Dom Higiena Ekspertyzy metody minimax oraz metody Bayesa-Laplace'a i Savage'a. Zobacz strony, na których wspomniany jest termin kryterium Bayesa

Ekspertyzy metody minimax oraz metody Bayesa-Laplace'a i Savage'a. Zobacz strony, na których wspomniany jest termin kryterium Bayesa

Ćwiczenia. Firma planuje sprzedawać swoje produkty na rynkach, biorąc pod uwagę możliwe opcje popytu konsumenckiego P j , j = 1,4 (niski, średni, wysoki, bardzo wysoki). Firma opracowała trzy strategie sprzedaży towarów A 1, A 2, A 3. Wielkość obrotu (jednostek pieniężnych) w zależności od strategii i popytu konsumenckiego przedstawiono w tabeli.
P 1P 2P 3P 4
130+N10 20 25 + N/2
250 70 - N10 + N/225
325 – N/235 40 60 - N/2
gdzie N=3
Znane są możliwe stany popytu konsumenckiego, które wynoszą odpowiednio q 1 =0,3, q 2 =0,2, q 3 =0,4, q 4 =0,1. Konieczne jest znalezienie strategii sprzedaży, która maksymalizuje średni obrót firmy. W tym przypadku należy zastosować kryteria Walda, Hurwitza, Savage’a i Bayesa.

Rozwiązanie znaleźć za pomocą kalkulatora.
Kryterium Bayesa.
Zgodnie z kryterium Bayesa za optymalną przyjmuje się strategię (czystą) A i, która maksymalizuje średni zysk a lub minimalizuje średnie ryzyko r.
Liczymy wartości ∑(a ij p j)
∑(a 1,j p jot) = 33 0,3 + 10 0,2 + 20 0,4 + 26,5 0,1 = 22,55
∑(a 2,j p jot) = 50 0,3 + 67 0,2 + 11,5 0,4 + 25 0,1 = 35,5
∑(a 3,j p j) = 23,5 0,3 + 35 0,2 + 40 0,4 + 58,5 0,1 = 35,9

A jaP 1P 2P 3P 4∑(a ij p jo)
1 9.9 2 8 2.65 22.55
2 15 13.4 4.6 2.5 35.5
3 7.05 7 16 5.85 35.9
pj 0.3 0.2 0.4 0.1

Kryterium Laplace’a.
Jeżeli prawdopodobieństwa stanów natury są prawdopodobne, do ich oceny wykorzystuje się zasadę racji niedostatecznej Laplace’a, zgodnie z którą wszystkie stany natury przyjmuje się jako jednakowo prawdopodobne, tj.:
q 1 = q 2 = ... = q n = 1/n.
qi = 1/4
A jaP 1P 2P 3P 4∑(a ij)
1 8.25 2.5 5 6.63 22.38
2 12.5 16.75 2.88 6.25 38.38
3 5.88 8.75 10 14.63 39.25
pj 0.25 0.25 0.25 0.25
Wniosek: wybierz strategię N=3.
Kryterium Walda.
Zgodnie z kryterium Walda za optymalną przyjmuje się strategię czystą, która w najgorszych warunkach gwarantuje maksymalny zysk, tj.
a = max(min a ij)
Kryterium Walda koncentruje statystykę na najbardziej niekorzystnych stanach przyrody, tj. kryterium to wyraża pesymistyczną ocenę sytuacji.
A jaP 1P 2P 3P 4min(a ij)
1 33 10 20 26.5 10
2 50 67 11.5 25 11.5
3 23.5 35 40 58.5 23.5
Wniosek: wybierz strategię N=3.
Kryterium dzikie.
Kryterium minimalnego ryzyka Savage'a zaleca wybór optymalna strategia taki, w którym wielkość maksymalnego ryzyka jest minimalizowana w najgorszych warunkach, tj. pod warunkiem, że:
a = min(max r ij)
Kryterium Savage’a skupia statystykę na najbardziej niekorzystnych stanach natury, tj. kryterium to wyraża pesymistyczną ocenę sytuacji.
Znajdujemy macierz ryzyka.
Ryzyko– miara rozbieżności pomiędzy różnymi możliwymi wynikami przyjęcia określonych strategii. Maksymalne wzmocnienie w j-tej kolumnie b j = max(a ij) charakteryzuje korzystny stan natury.
1. Oblicz pierwszą kolumnę macierzy ryzyka.
r 11 = 50 - 33 = 17; r 21 = 50 - 50 = 0; r 31 = 50 - 23,5 = 26,5;
2. Oblicz drugą kolumnę macierzy ryzyka.
r 12 = 67 - 10 = 57; r 22 = 67 - 67 = 0; r 32 = 67 - 35 = 32;
3. Oblicz trzecią kolumnę macierzy ryzyka.
r 13 = 40 - 20 = 20; r 23 = 40 - 11,5 = 28,5; r 33 = 40 - 40 = 0;
4. Oblicz 4. kolumnę macierzy ryzyka.
r 14 = 58,5 - 26,5 = 32; r 24 = 58,5 - 25 = 33,5; r 34 = 58,5 - 58,5 = 0;
A jaP 1P 2P 3P 4
1 17 57 20 32
2 0 0 28.5 33.5
3 26.5 32 0 0

A jaP 1P 2P 3P 4max(a ij)
1 17 57 20 32 57
2 0 0 28.5 33.5 33.5
3 26.5 32 0 0 32
Wniosek: wybierz strategię N=3.
Kryterium Hurwitza.
Kryterium Hurwitza jest kryterium pesymizmu – optymizmu. Za optymalną strategię przyjmuje się taką, dla której zachodzi zależność:
max(s ja)
gdzie s i = y min(a ij) + (1-y)max(a ij)
Dla y = 1 otrzymujemy kryterium Walde'a, dla y = 0 otrzymujemy kryterium optymistyczne (maximax).
Kryterium Hurwitza uwzględnia możliwość zarówno najgorszego, jak i najlepszego zachowania się przyrody dla człowieka. Jak zostałeś wybrany? Jak gorsze konsekwencje błędnych decyzji, tym większa chęć zabezpieczenia się przed błędami, tym y jest bliższe 1.
Obliczamy s i.
s 1 = 0,5 10+(1-0,5) 33 = 21,5
s 2 = 0,5 11,5+(1-0,5) 67 = 39,25
s 3 = 0,5 23,5+(1-0,5) 58,5 = 41
A jaP 1P 2P 3P 4min(a ij)max(a ij)y min(a ij) + (1-y)max(a ij)
1 33 10 20 26.5 10 33 21.5
2 50 67 11.5 25 11.5 67 39.25
3 23.5 35 40 58.5 23.5 58.5 41
Wniosek: wybierz strategię N=3.
Zatem w wyniku decyzji gra statystyczna Według różnych kryteriów częściej niż pozostałe rekomendowano strategię A 3.

Kierownictwo firmy podejmuje decyzję o umiejscowieniu produkcji nowego produktu w określonym miejscu. Aby wyrobić sobie wyobrażenie o sytuacji na rynku nowego produktu w momencie opanowania produkcji, należy wziąć pod uwagę koszty dostarczenia konsumentowi gotowych produktów, rozwój infrastruktury transportowej i społecznej kraju regionu, konkurencji na rynku, relacji między podażą i popytem, ​​kursów walut i wielu innych. Możliwe opcje decyzji, których atrakcyjność inwestycyjną definiuje się jako procent wzrostu dochodów w stosunku do kwoty inwestycji kapitałowych, przedstawiono w tabeli.
Wybierać:
1) miejsce lokalizacji produkcji, jeżeli kierownik przedsiębiorstwa ma pewność, że sytuacja 4 będzie rozwijać się na rynku;
2) miejsce lokalizacji produkcji, jeżeli kierownictwo ocenia prawdopodobieństwo wystąpienia sytuacji 1 na 0,2; sytuacje 2 w 0,1; sytuacja 3 przy 0,25;
3) wybrać opcję w warunkach niepewności według kryterium: maximax, maximin, kryterium Laplace'a, kryterium Savage'a, kryterium Hurwitza (y = 0,3);
4) czy to się zmieni najlepsza opcja rozwiązania według kryterium Hurwitza, jeśli wartość a zwiększy się do 0,5?
5) zakładając, że dane w tabeli przedstawiają koszty przedsiębiorstwa, określić wyboru, jakiego dokona przedsiębiorstwo korzystając z każdego z nich następujące kryteria: maksymin; maksimax; kryterium Hurwitza (? = 0,3); Kryterium dzikości; Kryterium Laplace’a

Można założyć, że złoża są równomiernie rozmieszczone na całym terytorium. Takie podejście trudno uznać za uzasadnione, ponieważ wnioski uzyskane za jego pomocą nie mają logicznej podstawy. Jednakże kryterium Bayesa-Laplace'a nie jest bardziej arbitralne niż kryterium Hurwitza.


Stosowane jest podejście optymistyczne, podejścia oparte na kryterium Hurwitza, kryterium Bayesa-Laplace'a i kryterium Savage'a w tym przypadku następny widok

Kryterium Bayesa (Laplace'a) 27, 224 Podejście bayesowskie 27 Bilans 27 Równoważenie (lub równowaga)

Wśród tych kryteriów i reguł szczególne miejsce zajmują reguły i kryteria oparte na znanym twierdzeniu Bayesa. Podejście oparte na tym twierdzeniu pozwala, po pierwsze, na wykorzystanie w zarządzaniu niektórych zasad metodologicznych nauk przyrodniczych, a po drugie, na zapewnienie dostosowania sądów i podejmowania decyzji w miarę zdobywania doświadczenia. To drugie oznacza naukę zarządzania (w sensie podejmowania decyzji) w samym procesie zarządzania 1.

Czasami w trakcie operacji niepewność ujawnia się stopniowo, w miarę udostępniania informacji. W takim przypadku, aby uzasadnić decyzje, wygodnie jest zastosować tak obiektywne kryterium, jak późniejsze prawdopodobieństwo zdarzenia. Samo to prawdopodobieństwo najłatwiej jest obliczyć za pomocą wzoru Bayesa w kategoriach szans. Zastanówmy się nad istotą tego podejścia.

Kryterium Bayesa stosuje się w przypadkach, gdy znany jest rozkład prawdopodobieństwa możliwych stanów. Jeśli ten dyskretny rozkład prawdopodobieństwa jest dany przez zbiór prawdopodobieństw , to zgodnie z kryterium Bayesa strategia Si jest lepsza niż Sj (s > if

Szczególnymi przypadkami tego kryterium są kryterium Bayesa (dla A = 1) i kryterium Walda (dla A = 0).

Kryterium Bayesa-Laplace'a, w odróżnieniu od kryterium Walda, uwzględnia każdą z możliwych konsekwencji wszystkich opcji decyzyjnych

Kryterium Bayesa-Laplace’a nakłada na sytuację, w której podejmowana jest decyzja, następujące wymagania:

Gdy z = 1, kryterium przekształca się w kryterium Bayesa-Laplace’a, a gdy z = O – w kryterium Walda. Zatem wybór parametru z podlega subiektywności. Ponadto liczba wdrożeń pozostaje bez nadzoru. Dlatego to kryterium jest rzadko stosowane przy podejmowaniu decyzji technicznych.

Przeanalizowaliśmy kilka podstawowych podejść do podejmowania decyzji w przypadku niepewnych czynników w badanym modelu. Można podać przykłady, gdy wszystkie kryteria decyzyjne prowadzą do wyboru tego samego rozwiązania x e X, jednak zazwyczaj tak się nie dzieje, każde kryterium prowadzi do własnej decyzji (przykład tego rodzaju omówiony jest w następnym rozdziale). Dlatego pojawiają się dyskusje na temat tego, które kryterium jest preferowane i kiedy. podejmuje się próby skonstruowania jednego w oparciu o kilka kryteriów. W szczególności kryterium Hurwitza jest takim połączeniem dwóch kryteriów. Podejmowano także próby połączenia kryterium Hurvtza i kryterium Bayesa-Laplace’a. Wszystkie otrzymane kryteria charakteryzują się wysokim stopniem arbitralności. Naszym zdaniem jedyną drogą pokonania tych trudności jest podejście wielokryterialne, w którym decydent mógłby rozważyć warianty decyzji efektywne z punktu widzenia zestawu wskaźników i wybrać spośród nich najbardziej odpowiedni ich. Podejście to zastosowano w przykładzie podanym w następnym rozdziale. Oczywiście całość wskaźników nie powinna być zbyt duża.

Zwykle wypróbowuje się kilka konfiguracji inny numer elementy i struktura połączeń. Jeden z najbardziej ważne wskaźniki są objętością zbioru uczącego i zapewniają możliwość uogólniania w trakcie dalszej pracy, a na niej można osiągnąć pożądany wynik różne schematy. Najczęściej stosowane procedury to zejście sekwencyjne (z zestawem potwierdzającym) lub N-krotna walidacja krzyżowa. Można również zastosować potężniejsze kryteria informacyjne (1) uogólniona walidacja krzyżowa (GV), końcowy błąd przewidywania Akaike (FPE), kryteria Bayesa (BI) i kryteria Akaike (AI) (patrz ). W celu poprawy zdolności generalizacyjnych i wyeliminowania niebezpieczeństwa przeuczenia stosuje się także redukcję masy i eliminację (przerzedzanie drzew). Jednocześnie zmieniana jest architektura sieci, usuwane są niektóre połączenia i badany jest ich wpływ na wydajność. >,

KRYTERIUM BAYESA (LAPLACE’A) – w teorii decyzji kryterium podejmowania decyzji w przypadku braku informacji o względnych prawdopodobieństwach strategii „natury”. (Zobacz Problemy niepewne.) Według B.(L.)k. Proponuje się, aby wszystkim rozważanym strategiom nadać równe prawdopodobieństwa, a następnie przyjąć tę, która zapewnia największą oczekiwaną wypłatę. Wadą jest to, że zakres ocenianych alternatyw w tym samym problemie może być różny, a co za tym idzie, względne prawdopodobieństwo każdej z nich może być również różne.

Kryterium Hodgesa-Lehmana. Przy realizacji tego kryterium wykorzystuje się dwa subiektywne wskaźniki: po pierwsze, rozkład prawdopodobieństwa stosowany w kryterium Bayesa, a po drugie, „parametr optymizmu” z kryterium Hurwitza

Kryterium Hodge’a-Lehmana opiera się jednocześnie na kryteriach Walda i Bayesa-Laplace’a

Poszukując optymalnych rozwiązań, najczęściej korzystają z nich różne kryteria, dając pewien schemat podejmowania decyzji. Przyjrzyjmy się niektórym z nich.

Kryterium Bayesa. Statystyk stosując kryterium Bayesa zna prawdopodobieństwa q k wystąpienia zdarzenia P k. Zazwyczaj prawdopodobieństwa q k wyznacza się drogą eksperymentów. Takie prawdopodobieństwa nazywane są późniejszymi. Strategię czystą przyjmuje się jako optymalną zgodnie z kryterium Bayesa A ja, przy którym średnia statystyka wygranej staje się maksymalna.

Kryterium Laplace’a. Kryterium Laplace'a różni się od kryterium Bayesa tym, że prawdopodobieństwa późniejsze są nieznane. Następnie są one traktowane jako równe i obliczane za pomocą wzoru

Kryterium dzikie. Kryterium to jest kryterium skrajnego pesymizmu, tj. statystyk wychodzi z założenia, że ​​natura postępuje przeciwko niemu w najgorszy możliwy sposób. Kryterium Savage'a zaleca wybranie jako optymalnej strategii czystej A i, przy której maksymalne ryzyko jest minimalne. Ryzyko to nazywa się minimax i jest obliczane według wzoru

Kryterium Walda. Podobnie jak kryterium Savage'a, kryterium Walda jest kryterium skrajnego pesymizmu. Dlatego statystyk wybiera czystą strategię A, w której najmniejsza wypłata będzie maksymalna. Zysk ten nazywany jest maksyminacją i jest obliczany według wzoru

Kryterium Hurwitza. Kryterium to jest kryterium pesymizmu-optymizmu i zaleca stosowanie czegoś pośredniego. W tym przypadku statystyk wybiera czystą strategię A i, dla której zachodzi warunek:

gdzie γ=0÷1 wybiera się na podstawie subiektywnych rozważań. Gdy γ = 1, kryterium Hurwitza przekształca się w kryterium Walda.

Przykład 4.6. Powstaje studio do naprawy telewizorów warunki szpitalne. Dla uproszczenia przyjmujemy, że napływ wniosków o naprawę wyraża się liczbami 2, 4, 6 i 8 tysięcy wniosków rocznie. Z doświadczenia wiadomo, że zysk z naprawy jednego telewizora to 9 den. jednostki W roku. Straty spowodowane brakiem naprawy z powodu braku wydajności - 5 den. jednostki Straty z tytułu przestoju specjalistów i sprzętu w przypadku braku aplikacji - 6 dni. jednostki dla każdej aplikacji.



Podaj informację o możliwościach tworzonego studia według podanych kryteriów.

Rozwiązanie. Gracz A jest tutaj ciałem podejmującym decyzje dotyczące pojemności tworzonego studia. Jego czyste strategie to:

▪ A 1 – otwarcie studia o wydajności 2 tys. telewizorów rocznie;

§ A 2 - otwarcie studia o wydajności 4 tys. telewizorów rocznie;

▪ A 3 – otwarcie studia o wydajności 6 tys. telewizorów rocznie;

▪ 4 - otwarcie studia o wydajności 8 tys. telewizorów rocznie.

Drugim graczem jest ogół wszystkich okoliczności, w jakich kształtuje się potok zgłoszeń naprawy telewizora w studiu, tj. Natura P. Natura może osiągnąć dowolny z czterech stanów:

P 1- przepływ wyniesie 2 tysiące telewizorów rocznie;

▪ P g – przepływ wyniesie 4 tys. telewizorów rocznie;

P 3- przepływ wyniesie 6 tys. telewizorów rocznie;

§ P 4- przepływ wyniesie 8 tys. telewizorów rocznie.

Obliczmy wypłaty a ik gracza A w dowolnej kombinacji okoliczności ( A ja , P k). Najkorzystniejsze będą sytuacje, gdy liczba otrzymanych zgłoszeń będzie zgodna z możliwościami studia.

Dla kombinacji ( A 1, P 1) zysk wyniesie 11 = 2 * 9 = 18 tys. jednostki, dla kombinacji ( A 2, P 2) mamy 22 = 4 * 9 = 36 tysięcy den. jednostki itp.

Dla sprawy ( A 1, P 2) w studiu można naprawić 2 tysiące telewizorów, wpłynęło 4 tysiące wniosków, straty w tym przypadku wyniosą 2*5 = 10 tysięcy. jednostek, a zysk całkowity a n =2*9-2*5=8 tys. den. jednostki

Dla sprawy ( A ja , P k) w studiu można naprawić 4 tysiące telewizorów, wpłynęło 2 tysiące wniosków, straty w tym przypadku wyniosą 2*6 = 12 tysięcy. jednostek i całkowity zysk a 21 = 18-12 = 6 tysięcy den. jednostki Podobnie znajdują się inne elementy macierzy płatności. Wyniki obliczeń przedstawiono w tabeli. 4.13.

Ze stołu 4.13 wynika z tego niższa cena netto gry

i górną cenę netto gry

Ponieważ α ≠ β, gra nie zawiera punktu siodłowego. Statystyk nie ma strategii dominujących.____________

Kryterium Bayesa. Niech będą znane prawdopodobieństwa q k stanu natury P k. W tabeli. 4.13 te prawdopodobieństwa są oznaczone jako . Korzystając ze wzoru (4.23) znajdujemy wartości średnich wygranych. Wartości te podane są w siódmej kolumnie tabeli. 4.13. Za optymalną według kryterium Bayesa przyjmuje się czystą strategię A 3 (otwarcie warsztatu na 6 tys. napraw rocznie), w której średni zysk jest statystyką .

Tabela 4.13

P 1(2) P 2(4) P 3(6) P 4(8) α ja 0,8α tj δi 0,2δi Cześć
1 (2) -2 -12 -12 3,5 -9,6 3,6 -6
2 (4) 23,5 4,8 7,2
3 (6) -6 -6 29,5 -4,8 10,8
4 (8) -18 -18 25,5 -14,4 14,4
β ja
0,2 0,35 0,25 0,2
0,25 0,25 0,25 0,25

Stosowane są tu następujące oznaczenia:

Kryterium Laplace’a. Zgodnie z tym kryterium zakłada się, że prawdopodobieństwa są równe i oblicza się je za pomocą wzoru

Czysta strategia A 3 jest również uznawana za optymalną zgodnie z kryterium Laplace'a, dla którego statystyki średnich wypłat

Kryterium dzikie. Aby przeanalizować grę tą metodą, skonstruujemy macierz ryzyka. Do obliczeń stosuje się wzory (4.21), (4.22). Wyniki obliczeń przedstawiono w tabeli. 4.14.

Jak wynika z tabeli. 4.14, minimum wszystkich maksymalnych ryzyk jest równe . Ryzyko to odpowiada czystej strategii A3 (otwarcie warsztatu na 6 tys. napraw rocznie).

Tabela 4.14

P 1 P 2 P 3 P 4 maks Rik
1
2
3
4

Kryterium Walda. Ze stołu 4.13 wyraźnie widać niższą cenę netto gry . Cena ta odpowiada czystej strategii A g (otwarcie pracowni za 4 tys. napraw rocznie).

Kryterium Hurwitza. Załóżmy γ = 0,8. Obliczamy za pomocą wzoru δi= max a ik (patrz kolumna 10 tabeli 4.13). Następnie korzystając z danych z kolumn 6 i 10 tabeli. 4.13 przeprowadzamy obliczenia za pomocą wzoru.

Wynik przedstawiono w kolumnie 12 tabeli. 4.13. Znaczenie i pasuje do strategii 2(otwórz pracownię na 4 tysiące napraw rocznie).

Kryterium Laplace’a

W wielu przypadkach prawdopodobny wydaje się następujący rozumowanie: skoro przyszłe stany natury nie są znane, można je uznać za równie prawdopodobne. To podejście rozwiązujące jest stosowane w kryterium „niewystarczającego powodu” Laplace’a.

Aby rozwiązać problem, dla każdego rozwiązania obliczane jest matematyczne oczekiwanie wzmocnienia (przyjmuje się, że prawdopodobieństwa stanów natury są równe qj = 1/n, j = 1:n) i wybierane jest rozwiązanie, przy którym wartość tego wzmocnienia jest maksymalna.

Hipoteza o równoważnym prawdopodobieństwie stanów natury jest dość sztuczna, dlatego zasadę Laplace'a można zastosować tylko w ograniczonych przypadkach. W więcej przypadek ogólny należy założyć, że stany natury nie są jednakowo prawdopodobne i do rozwiązania zastosować kryterium Bayesa-Laplace'a.

Kryterium Bayesa-Laplace'a

Kryterium to odbiega od warunków całkowitej niepewności – zakłada, że ​​możliwym stanom natury można przypisać określone prawdopodobieństwo ich wystąpienia i po ustaleniu matematycznego oczekiwania zysku dla każdej decyzji wybrać ten, który zapewnia największą wartość zysku:

Metoda ta zakłada możliwość wykorzystania dowolnych wstępnych informacji o stanach przyrody. Zakłada to zarówno powtarzalność stanów przyrody, jak i powtarzalność decyzji, a przede wszystkim dostępność wystarczająco wiarygodnych danych o przeszłych stanach przyrody. Oznacza to, że na podstawie wcześniejszych obserwacji przewiduje się przyszły stan przyrody (zasada statystyczna).

Wracając do naszej tabeli 1, załóżmy, że q1=0,4, q2=0,2 i q3=0,4. Następnie, zgodnie z kryterium Bayesa-Laplace'a, uzupełniamy tabelę 1 o kolumnę oczekiwań matematycznych i spośród tych wartości wybieramy maksimum. Dostajemy tabelę 13.

Tabela 13.

Optymalnym rozwiązaniem jest X1.

Kryterium Bayesa-Laplace’a nakłada na sytuację, w której podejmowana jest decyzja, następujące wymagania:

  • v prawdopodobieństwa wystąpienia stanów Bj są znane i nie zależą od czasu;
  • v rozwiązanie jest implementowane (teoretycznie) nieskończenie wiele razy;
  • v w przypadku niewielkiej liczby wdrożeń rozwiązania dopuszczalne jest pewne ryzyko.

Przy odpowiednio dużej liczbie wdrożeń średnia wartość stopniowo się stabilizuje. Dlatego przy pełnym (nieskończonym) wdrożeniu eliminuje się wszelkie ryzyko.

Początkowa pozycja użytkownika – kryterium jest bardziej optymistyczne niż w przypadku kryterium Walda, zakłada jednak więcej wysoki poziomświadomość i odpowiednio długie wdrożenia.

Wymienione kryteria nie wyczerpują różnorodności kryteriów wyboru rozwiązania w warunkach niepewności, w szczególności kryteriów wyboru najlepszych strategii mieszanych, jednak to wystarczy, aby problem wyboru rozwiązania stał się niejednoznaczny:

Tabela 14. Optymalne opcje otrzymane przy zastosowaniu różnych kryteriów

Z tabeli 14 wynika, że ​​wybór optymalnego rozwiązania zależy od wybranego kryterium (i ostatecznie od założeń).

Wybór kryterium (a także wybór zasady optymalności) jest najtrudniejszym i najważniejszym zadaniem w teorii podejmowania decyzji. Jednak konkretna sytuacja nigdy nie jest na tyle niepewna, aby nie można było uzyskać choćby częściowej informacji dotyczącej rozkładu prawdopodobieństwa stanów natury. W tym przypadku po oszacowaniu rozkładu prawdopodobieństwa stanów natury stosuje się metodę Bayesa-Laplace'a lub przeprowadza się eksperyment w celu wyjaśnienia zachowania przyrody.

Ponieważ różne kryteria wiążą się z różnymi warunkami podejmowania decyzji, najlepszym sposobem porównania zaleceń określonych kryteriów jest uzyskanie dodatkowych informacji o samej sytuacji. W szczególności, jeśli podejmowana decyzja dotyczy setek maszyn o tych samych parametrach, wówczas zaleca się stosowanie kryterium Bayesa-Laplace'a. Jeśli liczba maszyn nie jest duża, lepiej zastosować kryteria minimax lub Savage.

Przykłady formuł rozwiązywania problemów

W tej części, korzystając z przykładu rozwiązywania problemów, musimy nauczyć się wyznaczać wektor strategii, wektor stanów i macierz płatności oraz stosować różne kryteria, aby uzyskać optymalne rozwiązanie.

Zadanie. Podjęto decyzję o otwarciu klubu jachtowego w nadmorskiej miejscowości. Ile jachtów należy zakupić (w przeliczeniu na: jeden jacht na 5 osób), jeśli szacunkowa liczba członków klubu wynosi od 10 do 25 osób. Roczna subskrypcja kosztuje 100 jednostek walutowych. Cena jachtu wynosi 170 jednostek pieniężnych. Wynajem pomieszczeń i przechowywanie jachtów kosztuje 730 jednostek pieniężnych rocznie.

Rozwiązanie. Bez wątpienia warto rozważyć liczbę kupowanych jachtów w przedziale od dwóch do pięciu (4 opcje) i liczbę potencjalnych żeglarzy od 10 do 25. Aby zmniejszyć objętość wyliczenia, ograniczymy się do opcji 10 , 15, 20, 25 (jeżeli wnioski uzyskane dla powiązanych opcji będą znacząco się różnić, przeprowadzimy dodatkową, wyjaśniającą kalkulację). Zatem: X= (Xi) = (2, 3, 4, 5) - liczba jachtów (i=1,2,3,4); B = (Bj) =(10, 15, 20, 25) - liczba członków klubu jachtowego (j=1,2,3,4).

Aby rozpocząć poszukiwania rozwiązania skonstruujemy macierz decyzyjną, której elementy pokazują zysk przy podejmowaniu i-tej decyzji przy j-tej liczbie członków klubu jachtowego:

aij = 100min(5Xi; Bj) – 170Xi – 730

te. decydująca zasada w naszym problemie jest ono sformułowane jako „dochody – koszty”.

Po wykonaniu prostych obliczeń wypełnijmy macierz decyzyjną (aij) (patrz tabela 15):

rozwiązanie matrycy gry teoretycznej

Tabela 15. Macierz płatności

Na przykład a11 = 100min(52, 10) - 1702-730 =-70

a12=100min(52, 15)-1702-730=-70

a13 = a14 = -70 (popyt na jachty pozostanie niezaspokojony). Wartości ujemne pokazują, że przy takich wskaźnikach popytu na jachty i ich dostępności klub jachtowy ponosi straty.

Kryterium Walda (wybór ostrożnej, pesymistycznej strategii) - dla każdej alternatywy (liczba jachtów w klubie) wybierana jest najgorsza sytuacja ( najmniejsza wartość wysokość zysku), a wśród nich znajduje się gwarantowany maksymalny efekt:

ZMM=max(-70; -240; -410; -580)=-70

Wniosek: podejmując decyzję stosując kryterium Walda, klub jachtowy powinien zakupić 2 jachty, a maksymalna przewidywana strata nie przekroczy 70 CU.

Kryterium Hurwitza (rozwiązanie kompromisowe pomiędzy wynikiem najgorszym a nazbyt optymistycznym). Rozważmy zmianę rozwiązania naszego problemu w zależności od wartości współczynnika optymizmu (w tabeli 16 wyróżniono wartości spełniające kryterium Hurwitza dla różnych):

Tabela 16. Rozwiązania Hurwitz dla różnych

Wniosek: za 0,5 powinieneś kupić 5 jachtów i spodziewać się zysku w wysokości około 170 rubli. (mamy nadzieję na dużą popularność naszego klubu i pewną stabilność finansową amatorów), przy = 0,2 nie powinniśmy kupować więcej niż 2 jachty (jesteśmy ostrożniejsi w naszych prognozach i najprawdopodobniej będziemy woleli odmówić tworzenia Klub).

Kryterium Savage'a (znalezienie minimalnego ryzyka). Wybierając rozwiązanie w oparciu o to kryterium, w pierwszej kolejności porównujemy macierz użyteczności z macierzą żalu D – dla naszego przykładu odejmując (-70) od pierwszej kolumny macierzy użyteczności, 260 od drugiej kolumny, 590 i 920 odpowiednio z trzeciej i czwartej kolumny otrzymujemy macierz ryzyka (patrz tabela 17):

Tabela 17. Macierz ryzyka

Najmniejsza wartość spośród maksymalnych elementów wiersza (wartości podświetlone w tabeli) jest równa:

ZS=min(990; 660; 340; 510)=340

Wniosek: kupując 4 jachty dla otwieranego przez nas klubu jachtowego, mamy pewność, że w najgorszym przypadku straty klubu nie przekroczą 340 CU.

Kryterium decyzyjne Bayesa-Laplace'a. Załóżmy, że istnieją dane statystyczne, które pozwalają oszacować prawdopodobieństwo wystąpienia konkretnego zapotrzebowania na członkostwo w klubie jachtowym: q=(0,1; 0,2; 0,4; 0,3). Następnie matematyczne oczekiwanie wartości zysku dla każdego z rozważanych wariantów rozwiązania (dostawa jachtów w klubie jachtowym):

a1r = (-700,1)+(-700,2)+(-700,4)+(-700,3) =-70,

a2r= (-2400,1)+(2600,2)+(2600,4)+(2600,3) =210;

a3r = 390; a4r = 370.

Wniosek: w rozważanej sytuacji najbardziej wskazany jest zakup 4 jachtów (w tym przypadku maksymalny oczekiwany zysk klubu jachtowego wyniesie 390 jednostek pieniężnych).

Aby zastosować kryterium Laplace'a, znajdujemy:

a1r = ((-70)+(-70)+(-70)+(-70)) / 4 = -70 ;

a2r = ((-240)+(260)+(260)+(260)) / 4 =135;

a3r = 215; a4r = 170.

Wniosek: przy równym prawdopodobieństwie wystąpienia takiego czy innego zapotrzebowania na członkostwo w klubie jachtowym należy zakupić 4 jachty i jednocześnie liczyć na zysk w wysokości 215 CU.

Wniosek ogólny. Rozważane kryteria prowadzą do różnych decyzji i tym samym dają do myślenia ( decyzja tutaj będzie w znacznym stopniu zależeć od psychologii i intuicji podmiotu decyzji). Nie jest to zaskakujące, ponieważ kryteria opierają się na różnych hipotezach. Wprowadzając tę ​​czy inną hipotezę dotyczącą zachowania środowiska, „usuwamy w ten sposób niepewność”, ale sama hipoteza jest jedynie założeniem, a nie wiedzą. Byłoby dziwne, gdyby różne założenia zawsze prowadziły do ​​tego samego rezultatu.

Podejmowanie decyzji pod ryzykiem

Jak wspomniano powyżej, podejmowanie decyzji w warunkach ryzyka charakteryzuje się tym, że zachowanie przyrody (środowiska) jest losowe. Przejawia się to w tym, że istnieje pewna miara prawdopodobieństwa, według której powstają (występują) określone stany natury. Jednocześnie twarz Dane rozwiązanie posiada pewną informację o prawdopodobieństwie wystąpienia stanów otoczenia, które mogą mieć bardzo różnorodny charakter. Przykładowo, istnieją trzy stany środowiska B1, B2 i B3, wówczas dodatkową informacją o wystąpieniu tych stanów może być informacja, że ​​stan B1 jest najmniej prawdopodobny, a stan B3 bardziej prawdopodobny.

W konsekwencji podejmowanie decyzji w warunkach ryzyka zakłada, oprócz określenia funkcji realizacji, określenie niektórych Dodatkowe informacje o prawdopodobieństwach stanu środowiska. Jeżeli zbiór stanów natury B jest skończony (liczba stanów jest równa m), to miara prawdopodobieństwa na nim może być określona przez wektor prawdopodobieństwa q=(q1, q2, …, qm), gdzie qj?0 I.

Zatem macierz wypłat w warunkach ryzyka można przedstawić w następujący sposób (patrz tabela 1)

Stany środowiska

Wybierając rozwiązanie Xi, gracz wie, że otrzyma jedną z wypłat a11, ..., a1m z prawdopodobieństwem odpowiednio q1, ..., qm. W konsekwencji wynik dla decydenta przy wyborze rozwiązania Xi jest zmienną losową

Zatem porównanie dwóch rozwiązań X1 i X2 sprowadza się do porównania odpowiadających im zmiennych losowych.

Wybór optymalnego rozwiązania zwykle opiera się na jednym z następujących kryteriów:

  • 1) Kryterium Bayesa-Laplace’a – wartość oczekiwana (zysk lub wydatek);
  • 2) kombinacje wartości oczekiwanej i wariancji;
  • 3) kryterium produktu;
  • 4) najbardziej prawdopodobne wydarzenie w przyszłości i inne.

Przyjrzyjmy się bliżej kryterium Bayesa-Laplace'a.

Test wartości oczekiwanej (test Bayesa-Laplace'a)

Na ostatnim wykładzie przyjrzeliśmy się kryterium Bayesa-Laplace'a. Stosowanie tego kryterium (w literaturze spotyka się inną nazwę – kryterium „oczekiwanej wartości średniej”) wynika z chęci maksymalizacji oczekiwanych zysków (lub minimalizacji oczekiwanych kosztów). Zastosowanie wartości oczekiwanych implikuje możliwość wielokrotnego rozwiązywania tego samego problemu, aż do uzyskania wystarczająco dokładnych wartości. formuły obliczeniowe. Matematycznie wygląda to tak: niech o będzie zmienną losową z oczekiwaniem matematycznym Mo i wariancją Do. Jeśli x1, x2,..., xn są wartościami zmienna losowa(s.v.) och, w takim razie średnia arytmetyczna ich (średnia z próbki) wartości

ma wariancję. Zatem, gdy n>

Innymi słowy, przy wystarczająco dużej próbie różnica między średnią arytmetyczną a oczekiwaniem matematycznym dąży do zera (tzw. twierdzenie graniczne teorii prawdopodobieństwa). W związku z tym stosowanie kryterium „wartości oczekiwanej” ma sens tylko w przypadku, gdy to samo rozwiązanie trzeba zastosować odpowiednio dużą liczbę razy. Jest też odwrotnie: skupianie się na oczekiwaniach doprowadzi do błędnych wyników w przypadku decyzji, które należy podjąć niewielką liczbę razy.

Zanim przejdziemy do modyfikacji kryterium Bayesa-Laplace'a, rozważmy to kryterium bardziej szczegółowo.

Wiadomo, że naturalną cechą numeryczną zmiennej losowej o jest jej matematyczne oczekiwanie Mo, do którego zbliża się średnia wartość tej zmiennej losowej w dużej liczbie testów.

Jeśli osoba sprzeciwiająca się naturze dysponuje danymi statystycznymi dotyczącymi prawidłowości występowania konkretnych przejawów natury, wówczas problem można łatwo rozwiązać za pomocą metod probabilistycznych.

Zatem jeśli prawdopodobieństwa stanów natury są znane i nie zmieniają się w czasie (stacjonarne), to rozwiązanie maksymalizujące oczekiwany zysk (co daje największe matematyczne oczekiwanie zysku w stosunku do znanej strategii natury - stanu lub warunku) powinno uznać za optymalne.

Przykład. Firma kupiła maszynę za 100 jednostek pieniężnych. Aby go naprawić, możesz kupić specjalny sprzęt za 50 jednostek. lub zajmij się starym sprzętem. Jeśli maszyna ulegnie awarii, jej naprawa za pomocą specjalnego sprzętu kosztuje 10 jednostek, bez specjalnego wyposażenia - 40 jednostek. Wiadomo, że w okresie użytkowania maszyna ulega awarii nie więcej niż trzy razy: prawdopodobieństwo, że maszyna się nie zepsuje, wynosi 0,3; przerwy 1 raz - 0,4; przerwy 2 razy - 0,2; przerwy 3 razy - 0,1. Konieczne jest określenie możliwości zakupu specjalistycznego sprzętu naprawczego.

Formalizowanie. Pierwszy gracz ma dwie czyste strategie: kup (X1) i nie kupuj (X2) specjalistycznego sprzętu naprawczego. Natura, drugi gracz, ma cztery stany: maszyna nie zawiedzie, zawiedzie raz, zepsuje się dwa razy i zepsuje się trzy razy. Funkcja wypłaty to koszty poniesione przez firmę na zakup i naprawę maszyny, określone przez macierz płatności (patrz tabela 1):

Tabela 1.

Awaria maszyny

B1, nigdy

X1, nie kupuj

X2, kup

Rozwiązanie. Rozważmy najpierw ten problem jako grę antagonistyczną. Stosując metodę minimax, znajdujemy punkt siodłowy macierzy: (X2, B4), zatem cena gry wynosi v= - 180 jednostek pieniężnych (patrz tabela 2).

Tabela 2.

Awaria maszyny

B1, nigdy

X1, nie kupuj

X2, kup

Odpowiedź: musisz kupić specjalistyczny sprzęt.

Jednak w grach z naturą sytuacja zmienia się radykalnie: warunek zawiera już stabilną strategię mieszaną natury: q = (0,3; 0,4; 0,2; 0,1) i wiemy, że tej strategii przestrzega przyroda.

Jeśli osoba - pierwszy gracz - będzie nadal grać optymalnie, to jego wypłata wyniesie M=-150Х0,3-160Ч0,4-170Ч0,2-180Ч0,1=-161, a jeśli zastosuje pierwszą, nieoptymalną strategii, wówczas jego matematyczne oczekiwania wygrana wyniesie M=-100Х0,3 - 140Х0,4 - 180Х0,2 -220Х0,1 =-144.

Dlatego pierwszemu graczowi opłaca się grać nieoptymalnie!

Tabela 3.

Awaria maszyny

B1, nigdy

X1, nie kupuj

X2, kup

Odpowiedź: nie kupuj specjalistycznego sprzętu.

Istotną różnicę pomiędzy wartościami v(x*) i v(x") tłumaczy się tym, że mieszana strategia przyrody nie jest optymalna i „odchodząc” od swojej optymalnej strategii „przegrywa” 36 jednostki pieniężne wygranych.

Zatem w grze z naturą orientacja na matematyczne oczekiwanie wygranej jest w rzeczywistości orientacją na średnią wygraną, jaką uzyskamy, gdy tę grę powtórzymy wiele razy (przy założeniu, że warunki gry nie ulegną zmianie). Oczywiście, jeśli gra faktycznie jest powtarzana wiele razy, to kryterium średniego zysku (np. w problemach ekonomicznych - średni zysk) można uznać za uzasadnione. Czy jednak rozsądne jest skupienie się na tym kryterium w jednym teście?

Rozważ następujący przykład. Firma I może wystawić na sprzedaż jeden z towarów TI1 lub TI2, a firma II może zaoferować jeden z towarów TII1, TII2, TII3. Towary TI1 i TII1 są konkurencyjne (np. piwo i lemoniada), a towary TI1 i TII3 są komplementarne (np. piwo i płoć); inne produkty są neutralne. Zysk firmy I zależy od kombinacji towarów oferowanych do sprzedaży przez obie firmy i określa tabela 4. Wiadomo, że firma II wystawia na sprzedaż produkt TII3 trzy razy rzadziej niż TII1 i cztery razy rzadziej niż TII2 . Jaki produkt sprzedać firmie I?

Tabela 4

Stany środowiska

Oto decyzja o wystawieniu na sprzedaż przez firmę I produktu TI1, decyzja X2 o wystawieniu na sprzedaż przez firmę I produktu TI2.

Obliczmy oczekiwania matematyczne dla tej tabeli:

M=8H3/8+18H4/8+40H1/8=17, M=18H3/8+15H4/8+14H1/8=16.

Optymalną strategią będzie rozwiązanie X1, tj. Firma I dostarcza towary do TI1. Oczywiście wypłata 17 jednostek pieniężnych jest lepsza niż 16. Wybierając jednak rozwiązanie X1, otrzymamy nie 17 jednostek pieniężnych, ale jedną z wygranych: 8, 18 lub 40. Wybierając rozwiązanie X2, otrzymamy nie 16 jednostek pieniężnych, ale jedna z wygranych to 18, 15 lub 14. Sporządźmy tabelę pokazującą odchylenia możliwych wygranych od ich oczekiwanych wartości i prawdopodobieństwo tych odchyleń.

Tabela 5. Wartości odchyleń

Z tej tabeli widać, że przy równych oczekiwanych wygranych odchylenia od oczekiwanych wygranych prowadzą różnie: dla X1 te odchylenia są znaczące, a dla X2 stosunkowo małe.

Z analizy wynika, że: w warunkach ryzyka kryterium Bayesa-Laplace’a (oczekiwany średni zysk) nie jest adekwatne i należy je zmienić, biorąc pod uwagę możliwe odchylenia zmienna losowa od jej wartości średniej.

W teorii prawdopodobieństwa wariancja Do lub odchylenie standardowe y= jest zwykle używana jako miara odchylenia zmiennej losowej od jej wartości średniej. W przypadku problemów decyzyjnych w warunkach ryzyka odchylenie standardowe y będziemy traktować jako wskaźnik ryzyka, ponieważ y ma ten sam wymiar co zmienna losowa o, oczekiwanie matematyczne Mo.

Zatem, aby podjąć decyzję w warunkach ryzyka, wybór alternatywnego Xi prowadzi do zmiennej losowej oi, którą można scharakteryzować za pomocą pary wskaźników (Mo, уi). Zacznijmy teraz konstruować odpowiednie kryterium porównywania alternatyw. W rzeczywistości otrzymujemy tutaj problem optymalizacji składający się z dwóch kryteriów, gdzie kryteriami cząstkowymi są oczekiwanie matematyczne Mo (należy maksymalizować wartość tego kryterium) i odchylenie standardowe y (należy minimalizować wartość tego kryterium).

Rozważmy znalezienie rozwiązań optymalnych w sensie Pareto dla tego wielokryterialnego problemu. Załóżmy, że należy wybrać jedno rozwiązanie optymalne ze zbioru rozwiązań dopuszczalnych, z których każde jest określone przez parę wskaźników (Moi, уi). Przedstawiając punkty o współrzędnych (Moi, уi) na płaszczyźnie współrzędnych, uzyskujemy obraz typu pokazanego na ryc. 1, tj. otrzymaliśmy przestrzeń szacunków. Lewa strona znaczenie obrazu (czerwone kropki). oczekiwanie matematyczne przyjęliśmy wartości dodatnie i y ujemne, ponieważ Musimy zminimalizować to kryterium (y). Optymalne szacunki Pareto są prawidłowe Górna granica i odpowiednio rozwiązania optymalne Pareto X1, X2, X9 i X7.

W tym przykładzie zbiorem rozwiązań optymalnych Pareto jest X1, X2, X9, X7 i z tego zbioru dokonuje się ostatecznego wyboru rozwiązania optymalnego. Jak wspomniano powyżej, istnieją tutaj dwa podejścia: pierwsze podejście polega na skonstruowaniu zestawu rozwiązań optymalnych w Pareto i z tego zestawu decydent wybiera unikalne rozwiązanie w oparciu o nieformalne dodatkowe rozważania. Rozważmy drugie podejście polegające na zawężeniu zbioru alternatyw optymalnych w Pareto.

  • 1. Wybór kryterium głównego i wyznaczenie dolnych granic dla pozostałych kryteriów. Wyznaczmy dolną granicę według kryterium M i zminimalizujmy kryterium y. Za dolną granicę kryterium M przyjmujemy wartość M4 (patrz rys. 1), wówczas rozwiązaniem optymalnym będzie X2, zatem wśród rozwiązań spełniających warunek Mi? M4, jest najmniej ryzykowny.
  • 2. Optymalizacja leksykograficzna polega na uporządkowaniu kryteriów według ważności. Niech na przykład najważniejszym kryterium będzie M. Ponieważ jedyne rozwiązanie X7 ma według kryterium M wartość maksymalną, jest ono optymalne. To wyraźnie pokazuje wadę metody optymalizacji leksykograficznej: uwzględnienie jednego (najważniejszego) kryterium. Wada ta wiąże się z koniecznością wprowadzenia ścisłego priorytetu kryteriów i można ją usunąć poprzez osłabienie „sztywności” priorytetów. W tym przypadku stosowana jest metoda kolejnych koncesji (metoda zmiany celu), o której mowa powyżej.

Przykładowo w naszym przypadku jako ulga według kryterium M wartość D wskazana na ryc. 1. Wtedy efektem wyboru w pierwszym kroku będą alternatywy X7, X8, X9. Wśród nich najlepszy według drugiego kryterium będzie X9. Tym samym nieznacznie obniżając wymagania dla kryterium M, znacząco poprawiliśmy ocenę dla kryterium y (tj. niewielki spadek oczekiwanego zysku prowadził do istotnego ograniczenia ryzyka).


Ryż. 1.

Rozważmy zastosowanie uogólnionego kryterium do naszego problemu. Przyjmijmy jako uogólnione kryterium funkcję postaci:

f(M, y)= M-lChu, (1)

gdzie l jest pewną wartością stałą. W rzeczywistości kryterium (1) stanowi addytywne kryterium optymalności dla kryteriów cząstkowych M, y ze współczynnikami wagowymi 1 i - l. Gdy n>0, estymacja zmiennej losowej przy zastosowaniu kryterium addytywnego (1) jest mniejsza od jej wartości średniej, co jest typowe dla ostrożna osoba, tj. osoba unikająca ryzyka. Przeciwnie, gdy l<0 оценка (1) выше, чем среднее значение, что характеризует человека, склонного к риску. Наконец, при л=0 оценка случайной величины совпадает с её средним значением (т.е. возможные отклонения случайной величины от её среднего значения игнорируются) - это характеризует человека, безразличного к риску.

Merytoryczne znaczenie kryterium addytywnego (1) dla n>0 jest takie, że wzrost kryterium f(M, y) może nastąpić zarówno na skutek wzrostu M, jak i na skutek spadku y. Zatem dla osoby awersyjnej kryterium (1) odzwierciedla chęć zwiększenia oczekiwanego zysku i zmniejszenia ryzyka odchylenia od niego. W tym przypadku wskaźnik l charakteryzuje subiektywny stosunek decydenta do ryzyka. Dlatego l można uznać za subiektywny wskaźnik miary awersji do ryzyka (subiektywny wskaźnik ostrożności).

Wybór wariantu produktu, który ma zostać wyprodukowany. Firma może produkować produkty z sześciu rodzajów: parasole (Z), kurtki (K), płaszcze przeciwdeszczowe (P), torby (S), buty (T) i (W). Szef firmy musi zdecydować, które z tego typu produktów będzie produkować w nadchodzącym sezonie letnim. Zysk firmy zależy od tego, jakie będzie lato - deszczowe, gorące lub umiarkowane, i określa tabela 6. Która opcja produkcji będzie optymalna?

W przypadku braku dodatkowych informacji o stanach środowiska w warunkach niepewności, możliwe jest jego rozwiązanie poprzez przyjęcie dowolnej hipotezy o zachowaniu się środowiska. Jeśli decydent ma informacje na temat prawdopodobieństwa deszczowego, gorącego i umiarkowanego lata, wówczas określony problem staje się problemem decyzyjnym dotyczącym ryzyka. W tym przypadku niezbędne informacje można zaczerpnąć z danych statystycznych (obserwacji pogody na danym obszarze). Załóżmy, że prawdopodobieństwo deszczowego, gorącego i umiarkowanego lata wynosi odpowiednio 0,2, 0,5 i 0,3. Następnie otrzymujemy problem podejmowania decyzji w warunkach ryzyka, podane przez tabelę 7.

Tabela 6.

Znajdźmy oczekiwane wypłaty odpowiadające rozwiązaniom Z, K, P, S, T, W. Mamy:

MZ=0,2H80+0,5H60+0,3H40=58,

Mk=0,2H70+0,5H40+0,3H80=58,

MP=0,2H70+0,5H50+0,3H60=57,

MS=0,2H50+0,5H50+0,3H70=56,

MT=0,2H75+0,5H50+0,3H50=55,

DoZ=196, DoK=336, DoP=61, DoC=84, DoT=100, DoSh=231,5. Odchylenia standardowe rozważane zmienne losowe to:

yZ=14,0, yK=18,3, yP=7,8, yS=9,2, yT=10,0, ySh=15,2.

Zróbmy tabelę wartości kryteriów M i y dla każdej alternatywy (Tabela 8)

tabela 8

Kryteria

Przedstawmy rozważane rozwiązania jako punkty na płaszczyźnie współrzędnych zmiennych M i y i otrzymamy rys. 2, z którego rozwiązaniami optymalnymi Pareto są Z, P, Sh. Z tego zbioru należy dokonać ostatecznego wyboru alternatywy optymalnej.

Zawężenie zbioru optymalnego Pareto (najlepiej do jednego elementu) można przeprowadzić tylko wtedy, gdy istnieją dodatkowe informacje na temat związku pomiędzy kryteriami M i y. Jak wspomniano powyżej, można tego dokonać metodą kryterium głównego, metodą kolejnych koncesji lub stosując kryterium leksykograficzne.

Przegląd kryteriów decyzji w warunkach ryzyka

Kryterium prac

Reguła wyboru w tym przypadku jest sformułowana w następujący sposób:

Macierz decyzyjną uzupełniono o nową kolumnę zawierającą iloczyny wszystkich wyników każdego wiersza. Wybrane są te opcje, których linie zawierają najwyższe wartości tę kolumnę.

Zastosowanie tego kryterium wynika z następujących okoliczności:

  • · prawdopodobieństwa wystąpienia stanu Bj są nieznane;
  • · należy uwzględnić występowanie każdego ze stanów Bj z osobna;
  • · kryterium dotyczy również niewielkiej liczby wdrożeń rozwiązania;
  • · pewne ryzyko jest dopuszczalne.

Kryterium produktu dostosowuje się przede wszystkim do przypadków, w których wszystkie aij są dodatnie. W przypadku naruszenia warunku dodatniości należy wykonać przesunięcie aij+a z pewną stałą a>. Wynik będzie oczywiście zależał od a. W praktyce najczęściej

Jeżeli nie można uznać żadnej stałej za mającą znaczenie, wówczas kryterium iloczynu nie ma zastosowania.

Poprzedni Strona główna Następny

Podejmowanie decyzji w warunkach ryzyka z możliwością przeprowadzenia eksperymentu

Podejmując decyzję w warunkach niepewności (lub w warunkach ryzyka), zasadnicza trudność w wyborze rozwiązania powstaje w wyniku nieznajomości decydenta co do prawdziwego stanu środowiska. W poprzednich wykładach rozważano kilka kryteriów, z których każde na swój sposób „walczy” z niepewnością: poprzez stawianie hipotezy o zachowaniu otoczenia (kryterium Laplace'a, Walda, Hurwitza i Savage'a); poprzez uśrednienie uzyskanych zysków (kryterium Bayesa-Laplace'a lub kryterium oczekiwanego zysku); biorąc pod uwagę zarówno oczekiwany zysk, jak i miarę odchylenia od niego. Jednakże każde z tych podejść umożliwia jedynie racjonalną analizę niepewności, bez eliminowania samej niepewności. Eliminację lub przynajmniej redukcję niepewności można przeprowadzić jedynie w oparciu o wyjaśnienie prawdziwego stanu środowiska.

W praktyce takie wyjaśnianie odbywa się z reguły poprzez zbieranie dodatkowych informacji, a także przeprowadzanie eksperymentów, których wyniki służą do oceny aktualnego stanu środowiska. Na przykład przed rozpoczęciem leczenia pacjenta z niejasną diagnozą lekarz prowadzi dodatkowe testy; Przed odwierceniem drogiego odwiertu naftowego geolog przeprowadza badania sejsmiczne; Przed rozpoczęciem produkcji jakiegokolwiek produktu przedsiębiorca wykonuje partię próbną tego produktu itp. W ramach teorii podejmowania decyzji wszystkie te działania oznaczają nic innego jak przeprowadzenie eksperymentu w celu wyjaśnienia stanu środowiska.

Eksperyment nazywa się idealnym, jeśli na podstawie jego wyników decydent rozpoznaje prawdziwy stan środowiska. W praktyce przeprowadzenie doskonałego eksperymentu zdarza się dość rzadko. Najczęściej wynik eksperymentu dostarcza informacji, na podstawie których można wyjaśnić otoczenie.

Jak najskuteczniej wykorzystać wyniki eksperymentu i dostępne dane statystyczne przy podejmowaniu decyzji? Jedna z metod rozwiązania tego problemu opiera się na wzorze Bayesa – wzorze pozwalającym na ponowne oszacowanie prawdopodobieństw zdarzeń z uwzględnieniem wyników eksperymentu.

Należy pamiętać, że eksperyment nie jest możliwy dla każdego problemu decyzyjnego. Jeśli dla określonego zadania możliwy jest eksperyment, pojawia się zadanie oceny wykonalności jego wdrożenia. Faktem jest, że przeprowadzenie eksperymentu zawsze wiąże się z kosztami (materiałowymi, organizacyjnymi, czasowymi itp.).

[Rosen] pokazuje, że idealny eksperyment jest opłacalny wtedy i tylko wtedy, gdy jego koszt jest mniejszy niż minimalne oczekiwane ryzyko:

gdzie rij to ryzyko, C to koszt eksperymentu.

Aby przedstawić Bayesowskie podejście do reestymacji prawdopodobieństw, przypomnijmy sobie niektóre pojęcia z teorii prawdopodobieństwa.

Prawdopodobieństwo warunkowe zdarzenia A, przy założeniu, że zaszło zdarzenie B, oznacza się jako P(A/B) i oblicza się ze wzoru

Rozważmy następujący schemat prawdopodobieństwa. Niech B1, B2, …, Bm będą kompletną grupą zdarzeń i dla każdego zdarzenia Bj, j= znane jest jego prawdopodobieństwo P(Bj). Przeprowadźmy eksperyment, w wyniku którego zaszło zdarzenie A. Jeżeli znane są prawdopodobieństwa warunkowe P(A/Bj) dla wszystkich j=, to prawdopodobieństwo warunkowe (poeksperymentalne) zdarzenia Bj (j=, ) można znaleźć za pomocą wzoru Bayesa

Rozważmy teraz schematycznie problem podejmowania decyzji w warunkach ryzyka, określonych za pomocą macierzy wypłat, która ma tablicę postaci.

Tabela 1. Macierz płatności z wektorem probabilistycznym stanu środowiska

Stany środowiska

Tutaj B1, B2, …, Bm to stany otoczenia, aij to wypłata gracza w sytuacji, gdy wybierze on strategię Xi, a otoczenie przyjmie stan Bj. Decydent zna prawdopodobieństwo wystąpienia stanu Bj P(Bj)= qj oraz P(Bj)?0 i. Zakłada się, że ośrodek może znajdować się w jednym i tylko jednym ze stanów B1, B2, ..., Bm. Innymi słowy, zdarzenia losowe B1, B2, ..., Bm tworzą kompletną grupę zdarzeń, zatem można je traktować jako hipotezy. Prawdopodobieństwa stanów środowiska znane decydentowi P(Bj) (j=) są prawdopodobieństwami bezwarunkowymi (przedeksperymentalnymi, a priori).

Załóżmy, że przeprowadzany jest jakiś eksperyment, którego wynik w jakiś sposób zależy od istniejącego stanu środowiska. Jeżeli w wyniku eksperymentu zaobserwujemy zdarzenie A i dodatkowo dla wszystkich j= znane są prawdopodobieństwa warunkowe P(A/Bj), to korzystając ze wzoru Bayesa można znaleźć poeksperymentalne (posteryczne) prawdopodobieństwa prawdopodobieństwa każdego stanu środowiska. Znajomość wyrafinowanych prawdopodobieństw stanów środowiska pozwala na dokładniejsze określenie strategii decydenta.

Opisane podejście do podejmowania decyzji w warunkach ryzyka nosi nazwę bayesowską, gdyż opiera się na formule Bayesa. Podejście to ilustruje przykład omówiony poniżej.

Zadanie. Wiercenie szybu naftowego.

Szef grupy poszukiwawczej musi podjąć decyzję: wiercić szyb naftowy, czy nie. Odwiert może okazać się „suchy” (C), tj. bez oleju, „małej mocy” (M), tj. o niskiej zawartości oleju i „bogate” (B), tj. z dużą zawartością oleju. Alternatywy lidera grupy to: x1 – wierć i x2 – nie wierć. Zysk netto przy wyborze jednej z alternatyw, w zależności od możliwego rodzaju odwiertu, pokazano w tabeli zysków (patrz tabela 1)

Tabela 1. Macierz płatności

Cóż, wpisz

Dodatkowo lider grupy poszukiwawczej wie, że na danym obszarze prawdopodobieństwa wystąpienia odwiertu suchego, cienkiego lub bogatego wynoszą: P(C)=0,5, P(M)=0,3, P(B)=0,2.

Kierownik grupy poszukiwawczej może przeprowadzić eksperyment w celu wyjaśnienia struktury gleby (stanu środowiska). Eksperyment ten jest badaniem sejsmicznym, którego wynikiem będzie odpowiedź – jaka jest struktura gleby na danym obszarze (ale nie odpowiedź na pytanie o rodzaj studni!). Zasadniczo struktura gleby może być otwarta (O) lub zamknięta (C). Lider grupy dysponuje tabelą z wynikami eksperymentów podanych w tym obszarze (patrz tabela 2).

Tabela 2. Tabela danych eksperymentalnych

Tabela ta pokazuje, ile razy na glebach o strukturze otwartej i zamkniętej napotkano studnie typu C, M, B (czyli podaje łączną statystykę gruntów i rodzajów studni dla danego obszaru).

Przeanalizujmy dane eksperymentalne uzyskanej tabeli. Załóżmy, że przeprowadzono n eksperymentów, których wynikiem są wartości dyskretnych zmiennych losowych X (typ studni) i Y (struktura gleby), które przyjmują wartości C, M, B i O, Z. Oznaczmy przez n11 liczbę eksperymentów, w których X = C i Y=O, po n12 liczbę eksperymentów, w których X=C i Y=Z, po n21 liczbę eksperymentów, w których X=M i Y=O, itd. W naszym przypadku n=100, n11=45, n12=5, n21=11. Dzieląc wartości z tabeli 2 przez 100 (przez liczbę przeprowadzonych eksperymentów) otrzymujemy prawo rozkładu dwuwymiarowej zmiennej losowej (X, Y) podanej w formie tabelarycznej (patrz tabela 3).

Tabela 3. Seria statystyczna rozkład dwuwymiarowego r.v. (X, Y)

Z tabeli 3 wynika, że ​​P(X=C)=P(C)=0,5, P(X=M)=P(M)=0,3, P(X=B)=P(B)=0,2; Р(Y=O)=P(O)=0,6, Р(Y=З)=P(З)=0,4,

Zatem lider grupy musi zdecydować:

  • · czy przeprowadzić eksperyment (jego koszt to 10 jednostek);
  • · jeśli zostanie przeprowadzony, to co robić w przyszłości w zależności od wyników eksperymentu.

W ten sposób uzyskano wieloetapowy problem podejmowania decyzji w warunkach ryzyka. Opiszemy sposób znalezienia rozwiązania optymalnego.

Krok 1. Zbudujmy drzewo (ryc. 1), które wskazuje wszystkie etapy procesu decyzyjnego - drzewo decyzyjne. Gałęzie drzewa odpowiadają możliwym alternatywom, a wierzchołki odpowiadają pojawiającym się sytuacjom. Alternatywami dla lidera grupy poszukiwawczej są: b - odmowa eksperymentu, c - przeprowadzenie eksperymentu, x1 - ćwiczenie, x2 - brak ćwiczenia. Stany natury: wybór rodzaju studni (C, M, B), a także wybór struktury gleby (O, W).

Skonstruowane drzewo warunkuje zabawę lidera grupy z naturą. Pozycje w tej grze to wierzchołki drzewa, a ruchy graczy to wybrane przez nich rozwiązania. Pozycje, w których lider grupy wykonuje ruch, są oznaczone prostokątem; zakreślono miejsca, w których porusza się natura.

Gra przebiega w następujący sposób. W pozycji wyjściowej lider grupy wykonuje ruch. Musi podjąć decyzję – odmówić eksperymentu (wybierz rozwiązanie b) lub przeprowadzić eksperyment (wybierz rozwiązanie c). Jeżeli porzucił eksperyment, gra przechodzi do kolejnej pozycji, w której lider grupy musi podjąć decyzję: ćwiczyć (wybierz opcję x1) czy nie ćwiczyć (wybierz opcję x2). Jeśli zdecyduje się na eksperyment, gra przenosi się do pozycji, w której natura wykonuje ruch, wybierając jeden ze stanów O lub Z, odpowiadający możliwe rezultaty eksperyment itp. Gra kończy się w momencie osiągnięcia ostatecznej pozycji (tj. szczytu drzewa, z którego nie wychodzą żadne gałęzie)

Krok 2. Dla każdej decyzji będącej ruchem natury (czyli wychodzącej z pozycji oznaczonej kółkiem) musimy znaleźć prawdopodobieństwo tego ruchu. Aby to zrobić, postępujemy w następujący sposób. Dla każdej pozycji drzewa istnieje pojedyncza ścieżka łącząca tę pozycję z pozycją początkową. Jeżeli dotyczy to położenia natury, to droga łącząca je z położeniem początkowym nie przechodzi przez położenie (E), czyli eksperyment, to prawdopodobieństwa stanów P(S), P(M) i P(B ) są bezwarunkowe (przedeksperymentalne) i pochodzą z tabeli. 3:

P(S)=50/100, P(M)=30/100, P(B)=20/100.

Jeżeli dla położenia natury droga łącząca je z położeniem początkowym przechodzi przez położenie (E), wówczas prawdopodobieństwa stanów otoczenia stają się prawdopodobieństwami warunkowymi i wyznacza się je według wzorów (1), korzystając z danych z tabeli . 3:

W pozycji (E) prawdopodobieństwa ruchów prowadzących do pozycji (O) i (W) podano w tabeli 3: P(O)=0,6, P(Z)=0,4.


Ryż. 1.

Krok 3. Oceńmy wszystkie pozycje drzewa gry, „schodząc” od pozycji końcowych do pozycji początkowej. Ocena pozycji to oczekiwana wygrana na tej pozycji. Oszacowania dla pozycji końcowych znajdujemy w Tabeli 2. Wskazujemy teraz metodę znalezienia oszacowania dla dowolnej pozycji drzewa gry przy założeniu, że znaleziono już oszacowania dla wszystkich następujących po niej pozycji.

W przypadku natury jej ocena reprezentuje oczekiwany zysk (patrz rysunek 2);

W przypadku pozycji gracza oszacowanie jest wartością maksymalną ze wszystkich pozycji znajdujących się za nią. Motyw: na „swojej” pozycji gracz może wykonać dowolny ruch, więc wybierze ten, który doprowadzi do największej możliwej wygranej (patrz rysunek 3). Na każdej pozycji gracz zaznacza kreską gałąź drzewa prowadzącą do pozycji z maksymalną liczbą punktów.


Przejdźmy do rys. 1. Stwierdzamy, że w pozycji wyjściowej oczekiwany zysk bez przeprowadzenia eksperymentu (wariant b) wynosi 20 jednostek; oczekiwany zysk z eksperymentu (alternatywa c) wynosi 28 jednostek. Dlatego właściwym rozwiązaniem jest przeprowadzenie eksperymentu (eksperymentu sejsmicznego). Ponadto, jeśli eksperyment wykaże, że gleba jest otwarta, nie należy wykonywać wiercenia, ale jeśli jest zamknięta, należy wykonać wiercenie.

  • 1 - oddział: =20
  • 2 - oddział: 0
  • 3 - oddział:= -30
  • 4 - oddział: 0
  • 5 - oddział: =95
  • 6 - oddział: 0

Jak wynika z warunków zadania, możemy uzyskać wartość 95 jednostek z prawdopodobieństwem 0,4. Dlatego oczekiwana wygrana wyniesie 0,4*95=38 jednostek. Odejmujemy koszt eksperymentu równy 10 jednostkom.

W rezultacie otrzymujemy 28 jednostek.

Drzewa decyzyjne w sposób hierarchiczny reprezentują logiczną strukturę podejmowania decyzji, a tym samym ułatwiają zrozumienie problemu i procesu jego rozwiązywania. W przeciwieństwie do macierzy decyzyjnej, tutaj można zobaczyć przebieg procesu decyzyjnego w czasie. Jednakże drzewa decyzyjnego nie można ogólnie przedstawić za pomocą prostej macierzy decyzyjnej; W ten sposób można przedstawić jedynie poszczególne etapy procesu. Podział na etapy odbywa się w taki sposób, że wybór rozwiązania rozpoczyna się od określonego węzła decyzyjnego, z którego wywodzi się jedna lub więcej gałęzi reprezentujących opcje rozwiązania. Po tym następują węzły zdarzeń, a na końcu liście” reprezentujące stany końcowe wskazujące wartości odpowiednich parametrów wyjściowych. Jeśli po węzłach zdarzeń ponownie nastąpi węzeł decyzyjny z odpowiednimi działaniami, to ta i wszystkie kolejne gałęzie odnoszą się do więcej późne stadium wybór rozwiązania. W ten sposób można prześledzić całą ścieżkę od początku do końca drzewa decyzyjnego.

Drzewo decyzyjne rozróżnia węzły zdarzeń i węzły decyzyjne. Można sobie wyobrazić, że w węzłach zdarzeń determinowany jest wybór dalszej ścieżki warunki zewnętrzne(z natury, w teorii gier przez przeciwnika), a w węzłach decyzyjnych przez decydenta.

Drzewa decyzyjne są łatwe do modyfikacji: w razie potrzeby można je dalej rozwijać, a w przypadkach, gdy niektóre gałęzie są praktycznie bezsensowne, można je odpowiednio zmniejszyć. Węzły decyzyjne, jeśli są powiązane z jedną akcją i nie są rozdzielone węzłami zdarzeń, można łączyć. To samo dotyczy węzłów zdarzeń.



Nowość na stronie

>

Najbardziej popularny