Domov Hygiena Odborné posouzení metody minimax a metod Bayes-Laplace a Savage. Podívejte se na stránky, kde je zmíněno Bayesovo kritérium

Odborné posouzení metody minimax a metod Bayes-Laplace a Savage. Podívejte se na stránky, kde je zmíněno Bayesovo kritérium

Cvičení. Společnost plánuje prodávat své produkty na trzích s přihlédnutím k možným variantám spotřebitelské poptávky P j , j = 1,4 (nízká, střední, vysoká, velmi vysoká). Společnost vyvinula tři strategie prodeje zboží A 1, A 2, A 3. Objem obratu (peněžní jednotky) v závislosti na strategii a spotřebitelské poptávce je uveden v tabulce.
P 1P 2P 3P 4
A 130+N10 20 25 + N/2
A 250 70 - N10 + N/225
A 325 – N/235 40 60 - N/2
kde N=3
Jsou známy možné stavy spotřebitelské poptávky, které jsou q 1 =0,3, q 2 =0,2, q 3 =0,4, q 4 =0,1. Je potřeba najít takovou prodejní strategii, která maximalizuje průměrný obrat firmy. V tomto případě použijte kritéria Wald, Hurwitz, Savage a Bayes.

Řešení najít pomocí kalkulačky.
Bayesovo kritérium.
Podle Bayesova kritéria je jako optimální přijata strategie (čistá) A i, která maximalizuje průměrný zisk a nebo minimalizuje průměrné riziko r.
Počítáme hodnoty ∑(a ij p j)
∑(a 1,j p j) = 33 0,3 + 10 0,2 + 20 0,4 + 26,5 0,1 = 22,55
∑(a 2,j p j) = 50 0,3 + 67 0,2 + 11,5 0,4 + 25 0,1 = 35,5
∑(a 3,j p j) = 23,5 0,3 + 35 0,2 + 40 0,4 + 58,5 0,1 = 35,9

A iP 1P 2P 3P 4∑(a ij p j)
A 1 9.9 2 8 2.65 22.55
A 2 15 13.4 4.6 2.5 35.5
A 3 7.05 7 16 5.85 35.9
p j 0.3 0.2 0.4 0.1

Laplaceovo kritérium.
Pokud jsou pravděpodobnosti přírodních stavů věrohodné, použije se k jejich posouzení Laplaceův princip nedostatečného rozumu, podle kterého se všechny přírodní stavy považují za stejně pravděpodobné, tj.
q 1 = q 2 = ... = q n = 1/n.
qi = 1/4
A iP 1P 2P 3P 4∑ (a ij)
A 1 8.25 2.5 5 6.63 22.38
A 2 12.5 16.75 2.88 6.25 38.38
A 3 5.88 8.75 10 14.63 39.25
p j 0.25 0.25 0.25 0.25
Závěr: zvolte strategii N=3.
Waldovo kritérium.
Podle Waldova kritéria je jako optimální brána čistá strategie, která za nejhorších podmínek zaručuje maximální zisk, tzn.
a = max (min a ij)
Waldovo kritérium zaměřuje statistiku na nejnepříznivější přírodní stavy, tzn. toto kritérium vyjadřuje pesimistické hodnocení situace.
A iP 1P 2P 3P 4min(a ij)
A 1 33 10 20 26.5 10
A 2 50 67 11.5 25 11.5
A 3 23.5 35 40 58.5 23.5
Závěr: zvolte strategii N=3.
Divoké kritérium.
Savageovo kritérium minimálního rizika doporučuje výběr optimální strategii takový, ve kterém je velikost maximálního rizika minimalizována za nejhorších podmínek, tzn. pokud:
a = min (max r ij)
Savageovo kritérium zaměřuje statistiky na nejnepříznivější přírodní stavy, tzn. toto kritérium vyjadřuje pesimistické hodnocení situace.
Najdeme matici rizik.
Riziko– míra nesouladu mezi různými možnými výsledky přijetí určitých strategií. Maximální zisk v j-tém sloupci b j = max(a ij) charakterizuje příznivý přírodní stav.
1. Vypočítejte 1. sloupec matice rizik.
r11 = 50 - 33 = 17; r21 = 50 - 50 = 0; r31 = 50 - 23,5 = 26,5;
2. Vypočítejte 2. sloupec matice rizik.
r12 = 67 - 10 = 57; r22 = 67 - 67 = 0; r32 = 67 - 35 = 32;
3. Vypočítejte 3. sloupec matice rizik.
r13 = 40 - 20 = 20; r23 = 40 - 11,5 = 28,5; r33 = 40 - 40 = 0;
4. Vypočítejte 4. sloupec matice rizik.
r14 = 58,5 - 26,5 = 32; r24 = 58,5 - 25 = 33,5; r34 = 58,5 - 58,5 = 0;
A iP 1P 2P 3P 4
A 1 17 57 20 32
A 2 0 0 28.5 33.5
A 3 26.5 32 0 0

A iP 1P 2P 3P 4max(a ij)
A 1 17 57 20 32 57
A 2 0 0 28.5 33.5 33.5
A 3 26.5 32 0 0 32
Závěr: zvolte strategii N=3.
Hurwitzovo kritérium.
Hurwitzovo kritérium je kritériem pesimismu – optimismu. Za optimální strategii se považuje ta, pro kterou platí následující vztah:
max(s i)
kde s i = y min(a ij) + (1-y)max(a ij)
Pro y = 1 získáme Waldeovo kritérium, pro y = 0 optimistické kritérium (maximax).
Hurwitzovo kritérium bere v úvahu možnost nejhoršího i nejlepšího chování přírody pro člověka. Jak se vybírá? Jak horší následky u chybných rozhodnutí, čím větší je touha pojistit se proti chybám, tím blíže je y 1.
Vypočítáme s i.
s 1 = 0,5 10+(1-0,5) 33 = 21,5
s2 = 0,5 11,5+(1-0,5) 67 = 39,25
s3 = 0,5 23,5+(1-0,5) 58,5 = 41
A iP 1P 2P 3P 4min(a ij)max(a ij)y min(a ij) + (1-y)max(a ij)
A 1 33 10 20 26.5 10 33 21.5
A 2 50 67 11.5 25 11.5 67 39.25
A 3 23.5 35 40 58.5 23.5 58.5 41
Závěr: zvolte strategii N=3.
Tedy v důsledku rozhodnutí statistická hra Podle různých kritérií byla strategie A 3 doporučována častěji než ostatní.

Vedení společnosti se rozhodne umístit výrobu nového produktu do určité lokality. Pro vytvoření představy o situaci na trhu nového výrobku v době zvládnutí výroby je nutné vzít v úvahu náklady na dodání hotových výrobků spotřebiteli, rozvoj dopravní a sociální infrastruktury. regionu, konkurence na trhu, vztah mezi nabídkou a poptávkou, směnné kurzy a mnoho dalšího. Možné možnosti rozhodnutí, jejichž investiční atraktivita je definována jako procento růstu příjmů ve vztahu k výši kapitálových investic, uvádí tabulka.
Vybrat:
1) místo pro umístění výroby, pokud je vedoucí podniku přesvědčen, že se situace 4 na trhu vyvine;
2) místo pro umístění výroby, pokud vedení odhadne pravděpodobnost situace 1 na 0,2; situace 2 v 0,1; situace 3 v 0,25;
3) vyberte možnost za podmínek nejistoty podle kritéria: maximax, maximin, Laplaceovo kritérium, Savageovo kritérium, Hurwitzovo kritérium (y = 0,3);
4) Změní se nejlepší možnostřešení podle Hurwitzova kritéria, pokud se hodnota a zvýší na 0,5?
5) za předpokladu, že tabulkové údaje představují náklady podniku, určete volbu, kterou podnik provede při použití každého z následující kritéria: maximin; maximax; Hurwitzovo kritérium (? = 0,3); Savage kritérium; Laplaceovo kritérium

Předpokládalo by se, že ložiska jsou rozmístěna rovnoměrně po celém území. Tento přístup lze jen stěží považovat za legitimní, neboť závěry získané s jeho pomocí nemají logický základ. Bayes-Laplaceovo kritérium však není o nic arbitrárnější než kritérium Hurwitz.


Optimistický přístup, přístupy založené na Hurwitzově kritériu, Bayes-Laplaceově kritériu a Savageově kritériu mají v v tomto případě další pohled

Bayesovské (Laplaceovo) kritérium 27, 224 Bayesovský přístup 27 Rovnováha 27 Vyvážení (nebo rovnováha)

Mezi těmito kritérii a pravidly zaujímají zvláštní místo pravidla a kritéria založená na známé Bayesově větě. Přístup založený na této větě umožňuje za prvé využít některé metodologické principy přírodních věd v managementu a za druhé zajistit, aby se úsudky a rozhodování přizpůsobovaly nabytým zkušenostem. To druhé znamená naučit se řídit (ve smyslu rozhodování) v samotném procesu řízení 1.

Někdy se během operace nejistota odhaluje postupně, jak jsou k dispozici informace. V tomto případě je pro ospravedlnění rozhodnutí vhodné použít takové objektivní kritérium, jako je zadní pravděpodobnost události. Tato pravděpodobnost sama o sobě se nejsnáze vypočítá pomocí Bayesova vzorce z hlediska pravděpodobnosti. Podívejme se na podstatu tohoto přístupu.

Bayesovo kritérium se používá v případech, kdy je známo rozdělení pravděpodobnosti možných stavů. Pokud je toto diskrétní rozdělení pravděpodobnosti dáno množinou pravděpodobností , pak je podle Bayesova kritéria strategie Si výhodnější než Sj (s >

Speciálními případy tohoto kritéria jsou Bayesovo kritérium (pro A = 1) a Waldovo kritérium (pro A = 0).

Bayesovo-Laplaceovo kritérium, na rozdíl od Walda, bere v úvahu každý z možných důsledků všech možností rozhodnutí.

Bayes-Laplaceovo kritérium klade na situaci, ve které se rozhoduje, následující požadavky:

Když z = 1, je kritérium transformováno na Bayes-Laplaceovo kritérium a když z = O se změní na Waldovo kritérium. Volba parametru z tedy podléhá subjektivitě. Počet implementací navíc zůstává bez dozoru. Proto se toto kritérium při technických rozhodnutích používá jen zřídka.

Zkoumali jsme několik základních přístupů k rozhodování v případě nejistých faktorů ve studovaném modelu. Můžete uvést příklady, kdy všechna rozhodovací kritéria vedou k volbě stejného řešení x e X, ale obvykle se tak nestane, každé kritérium vede k vlastnímu rozhodnutí (příkladu tohoto druhu je věnována další kapitola). Vznikají proto diskuse o tom, které kritérium je vhodnější a kdy. pokusy sestrojit jeden na základě několika kritérií. Zejména Hurwitzovo kritérium je takovou kombinací dvou kritérií. Byly také učiněny pokusy zkombinovat Hurvtzovo kritérium a Bayes-Laplaceovo kritérium. Všechna výsledná kritéria mají vysoký stupeň libovůle. Jediným způsobem, jak tyto obtíže překonat, je podle našeho názoru multikriteriální přístup, kdy by rozhodovatel mohl zvážit varianty rozhodnutí, které jsou z hlediska souboru indikátorů efektivní, a vybrat ten nejvhodnější mezi jim. Tento přístup je použit v příkladu uvedeném v další kapitole. Souhrn ukazatelů by samozřejmě neměl být příliš velký.

Obvykle se zkouší několik konfigurací jiné číslo prvky a struktura spojů. Jeden z nejvíce důležité ukazatele jsou objemem tréninkové sestavy a zajištěním schopnosti zobecnění při další práci a požadovaného výsledku lze dosáhnout na různá schémata. Nejčastěji používanými postupy jsou sekvenční sestup (s konfirmační sadou) nebo N-násobná křížová validace. Lze také použít výkonnější informační kritéria (1) zobecněná křížová validace (GV), konečná chyba predikce Akaike (FPE), Bayesova kritéria (BI) a kritéria Akaike (AI) (viz ). Pro zlepšení generalizačních schopností a eliminaci nebezpečí přefitování se využívá i redukce a eliminace (prořezávání stromů). Zároveň se mění architektura sítě, odstraňují se některá spojení a studuje se jejich dopad na efektivitu. >,

BAYES (LAPLACE) KRITÉRIUM – v teorii rozhodování kritérium pro rozhodování při absenci jakýchkoliv informací o relativních pravděpodobností „přírodních“ strategií. (Viz Nejisté problémy.) Podle B.(L.)k. Navrhuje se přidělit stejné pravděpodobnosti všem zvažovaným strategiím a poté přijmout tu, která má největší očekávaný přínos. Má nevýhodu v tom, že rozsah hodnocených alternativ ve stejném problému může být různý a tudíž i relativní pravděpodobnost každé z nich může být různá.

Hodges-Lehmanovo kritérium. Při implementaci tohoto kritéria se používají dva subjektivní ukazatele: za prvé rozdělení pravděpodobnosti použité v Bayesově kritériu a za druhé „parametr optimismu“ z Hurwitzova kritéria.

Kritérium Hodge-Lehman je založeno současně na kritériích Wald a Bayes-Laplace

Při hledání optimálních řešení obvykle využívají různá kritéria, což dává nějaké schéma rozhodování. Podívejme se na některé z nich.

Bayesovo kritérium. Při použití Bayesova kritéria statistik zná pravděpodobnosti q k výskytu jevu P k. Pravděpodobnosti q k se obvykle určují pomocí experimentů. Takové pravděpodobnosti se nazývají zadní. Čistá strategie je přijímána jako optimální podle Bayesova kritéria A i, při kterém se průměrná výherní statistika stává maximální.

Laplaceovo kritérium. Laplaceovo kritérium se liší od Bayesova kritéria v tom, že zadní pravděpodobnosti nejsou známy. Pak se berou jako stejné a vypočítají se pomocí vzorce

Divoké kritérium. Toto kritérium je kritériem extrémního pesimismu, tzn. statistik vychází z předpokladu, že příroda proti němu jedná tím nejhorším možným způsobem. Kritérium Savage doporučuje zvolit jako optimální tu čistou strategii A i, při které je maximální riziko minimální. Toto riziko se nazývá minimax a počítá se podle vzorce

Waldovo kritérium. Stejně jako kritérium Savage je kritérium Walda kritériem extrémního pesimismu. Statistik proto volí čistou strategii A takovou, že nejmenší výnos bude maximální. Tento zisk se nazývá maximin a vypočítá se podle vzorce

Hurwitzovo kritérium. Toto kritérium je kritériem pesimismu-optimismu a doporučuje použít něco mezi tím. V tomto případě statistik zvolí čistou strategii A i, pro kterou platí následující podmínka:

kde γ=0÷1 je vybráno ze subjektivních úvah. Když γ = 1, Hurwitzovo kritérium se transformuje na Waldovo kritérium.

Příklad 4.6. Vzniká studio pro opravy televizorů lůžkové podmínky. Pro zjednodušení předpokládáme, že tok požadavků na opravy je vyjádřen čísly 2, 4, 6 a 8 tisíc žádostí za rok. Ze zkušenosti je známo, že zisk z opravy jednoho televizoru je 9 den. Jednotky v roce. Ztráty způsobené neopravením z důvodu nedostatku kapacity - 5 den. Jednotky Ztráty z prostojů specialistů a zařízení při absenci aplikací - 6 dní. Jednotky pro každou aplikaci.



Poskytněte informace o kapacitě vytvářeného ateliéru podle daných kritérií.

Řešení. Hráč A je zde orgánem, který rozhoduje o kapacitě vytvořeného studia. Jeho čisté strategie jsou:

■ A 1 - otevření studia s kapacitou 2 tisíce televizorů ročně;

§ A 2 - otevření studia s kapacitou 4 tisíc televizorů ročně;

■ A 3 - otevření studia s kapacitou 6 tisíc televizí ročně;

■ A 4 - otevření studia s kapacitou 8 tisíc televizí ročně.

Druhým hráčem je souhrn všech okolností, za kterých se tvoří tok požadavků na opravu TV ve studiu, tzn. Příroda P. Příroda může realizovat kterýkoli ze čtyř stavů:

P 1- tok bude 2 tisíce televizorů ročně;

■ P g - tok bude 4 tisíce televizorů ročně;

P 3- průtok bude 6 tisíc televizorů ročně;

§ P 4- průtok bude 8 tisíc TV ročně.

Vypočítejme výplaty a ik hráče A za jakékoli kombinace okolností ( A i, P k). Nejpříznivější budou situace, kdy se počet přijatých žádostí shoduje s možnostmi studia.

Pro kombinaci ( A 1, P 1) zisk bude a 11 = 2 * 9 = 18 tis. jednotky, pro kombinaci ( A 2, P 2) máme 22 = 4 * 9 = 36 tisíc denů. Jednotky atd.

Pro případ ( A 1, P 2) ve studiu můžete opravit 2 tisíce televizorů a bylo přijato 4 tisíce žádostí. Ztráty v tomto případě budou 2 * 5 = 10 tisíc. jednotek a celkový zisk a n =2*9-2*5=8 tisíc den. Jednotky

Pro případ ( A i, P k) ve studiu můžete opravit 4 tisíce televizorů a bylo přijato 2 tisíce žádostí. Ztráty v tomto případě budou 2 * 6 = 12 tisíc. jednotek a celkový zisk a 21 = 18-12 = 6 tisíc den. Jednotky Ostatní prvky platební matice se nacházejí podobně. Výsledky výpočtu jsou uvedeny v tabulce. 4.13.

Od stolu 4.13 vyplývá, že nižší čistá cena hry

a horní čistá cena hry

Protože α ≠ β, hra neobsahuje sedlový bod. Statistik nemá žádné dominantní strategie.____________

Bayesovo kritérium. Nechť jsou známy pravděpodobnosti q k přírodního stavu P k. V tabulce. 4.13 tyto pravděpodobnosti jsou označeny jako . Pomocí vzorce (4.23) zjistíme hodnoty průměrných výher. Tyto hodnoty jsou uvedeny v sedmém sloupci tabulky. 4.13. Jako optimální podle Bayesova kritéria je akceptována čistá strategie A 3 (otevření dílny pro 6 tisíc oprav ročně), ve které je průměrný zisk statistika .

Tabulka 4.13

P 1(2) P 2(4) P 3(6) P 4(8) α i 0,8α i δi 0,25i h i
A 1 (2) -2 -12 -12 3,5 -9,6 3,6 -6
A 2 (4) 23,5 4,8 7,2
A 3 (6) -6 -6 29,5 -4,8 10,8
A 4 (8) -18 -18 25,5 -14,4 14,4
β i
0,2 0,35 0,25 0,2
0,25 0,25 0,25 0,25

Jsou zde použity následující zápisy:

Laplaceovo kritérium. Podle tohoto kritéria jsou pravděpodobnosti považovány za stejné a vypočítané pomocí vzorce

Čistá strategie A 3 je také přijímána jako optimální podle Laplaceova kritéria, pro které jsou statistiky průměrného výnosu

Divoké kritérium. Pro analýzu hry pomocí této metody sestrojíme matici rizik. Pro výpočty se používají vzorce (4.21), (4.22). Výsledky výpočtu jsou uvedeny v tabulce. 4.14.

Jak vyplývá z tabulky. 4.14, minimum všech maximálních rizik se rovná . Toto riziko odpovídá čisté strategii A 3 (otevření dílny na 6 tisíc oprav ročně).

Tabulka 4.14

P 1 P 2 P 3 P 4 max rik
A 1
A 2
A 3
A 4

Waldovo kritérium. Od stolu 4.13 je zřejmé, že nižší čistá cena hry . Tato cena odpovídá čisté strategii A g (otevření ateliéru na 4 tisíce oprav ročně).

Hurwitzovo kritérium. Dejme γ = 0,8. Počítáme pomocí vzorce δi= max a ik (viz sloupec 10 tabulky 4.13). Poté pomocí údajů ve sloupcích 6 a 10 tabulky. 4.13 provedeme výpočet pomocí vzorce.

Výsledek je uveden ve sloupci 12 tabulky. 4.13. Význam a vhodné strategie A 2(otevřete ateliér na 4 tisíce oprav ročně).

Laplaceovo kritérium

V řadě případů se zdá věrohodná následující úvaha: protože budoucí stavy přírody jsou neznámé, lze je považovat za stejně pravděpodobné. Tento přístup řešení je použit v Laplaceově kritériu „nedostatečný důvod“.

K vyřešení problému se pro každé řešení vypočítá matematické očekávání zisku (předpokládá se, že pravděpodobnosti přírodních stavů se rovnají qj = 1/n, j = 1:n) a vybere se řešení, při kterém hodnota tohoto zisku je maximální.

Hypotéza o ekvipravděpodobnosti přírodních stavů je dosti umělá, takže Laplaceův princip lze použít jen v omezených případech. Ve více obecný případ měli bychom předpokládat, že přírodní stavy nejsou stejně pravděpodobné, a použít k řešení Bayes-Laplaceovo kritérium.

Bayes-Laplaceovo kritérium

Toto kritérium se odchyluje od podmínek naprosté nejistoty – předpokládá, že možným přírodním stavům lze přiřadit určitou pravděpodobnost jejich výskytu, a po určení matematického očekávání zisku pro každé rozhodnutí vyberte ten, který poskytuje největší hodnotu zisku:

Tato metoda předpokládá možnost využití jakýchkoliv předběžných informací o stavech přírody. To předpokládá jak opakovatelnost přírodních stavů, tak opakovatelnost rozhodnutí a především dostupnost dostatečně spolehlivých dat o minulých přírodních stavech. Tedy na základě předchozích pozorování předpovídat budoucí stav přírody (statistický princip).

Vrátíme-li se k naší tabulce 1, předpokládejme, že q1=0,4, q2=0,2 a q3=0,4. Poté podle Bayes-Laplaceova kritéria doplníme tabulku 1 o sloupec matematických očekávání a vybereme maximum z těchto hodnot. Dostáváme tabulku 13.

Tabulka 13.

Optimální řešení je X1.

Bayes-Laplaceovo kritérium klade na situaci, ve které se rozhoduje, následující požadavky:

  • v pravděpodobnosti výskytu stavů Bj jsou známé a nezávisí na čase;
  • v řešení je implementováno (teoreticky) nekonečně mnohokrát;
  • v pro malý počet implementací řešení je určité riziko přijatelné.

Při dostatečně velkém počtu implementací se průměrná hodnota postupně ustálí. Při plné (nekonečné) implementaci je tedy eliminováno jakékoli riziko.

Výchozí pozice uživatele – kritérium je optimističtější než v případě Waldova kritéria, předpokládá však více vysoká úroveň povědomí a dostatečně dlouhé realizace.

Uvedená kritéria nevyčerpávají rozmanitost kritérií pro výběr řešení za podmínek nejistoty, zejména kritéria pro výběr nejlepších smíšených strategií, nicméně to stačí k tomu, aby se problém výběru řešení stal nejednoznačným:

Tabulka 14. Optimální možnosti získané pomocí různých kritérií

Z tabulky 14 je zřejmé, že volba optimálního řešení závisí na zvoleném kritériu (a v konečném důsledku na předpokladech).

Volba kritéria (stejně jako volba principu optimality) je nejobtížnějším a nejdůležitějším úkolem v teorii rozhodování. Konkrétní situace však nikdy není tak nejistá, aby nebylo možné získat alespoň částečnou informaci o pravděpodobnostním rozložení přírodních stavů. V tomto případě se po odhadu pravděpodobnostního rozložení stavů přírody použije Bayes-Laplaceova metoda, případně se provede experiment k objasnění chování přírody.

Vzhledem k tomu, že různá kritéria jsou spojena s různými podmínkami, za kterých je přijímáno rozhodnutí, nejlepším způsobem, jak porovnat doporučení určitých kritérií, je získat dodatečné informace o samotné situaci. Zejména pokud se přijímané rozhodnutí týká stovek strojů se stejnými parametry, pak se doporučuje použít Bayes-Laplaceovo kritérium. Pokud počet strojů není velký, je lepší použít kritéria minimax nebo Savage.

Příklady formulací řešení problémů

V této části se na příkladu řešení problémů musíme naučit určovat vektor strategií, vektor stavů a ​​platební matici a aplikovat různá kritéria pro získání optimálního řešení.

Úkol. Bylo rozhodnuto otevřít v přímořském městě jachtařský klub. Kolik jachet je třeba zakoupit (na základě: jedna jachta pro 5 osob), pokud se odhadovaný počet členů klubu pohybuje od 10 do 25 osob. Roční předplatné stojí 100 měnových jednotek. Cena jachty je 170 peněžních jednotek. Pronájem prostor a skladování jachet stojí 730 peněžních jednotek ročně.

Řešení. Bezesporu má smysl uvažovat o počtu zakoupených jachet v rozmezí od dvou do pěti (4 možnosti) a počtu potenciálních jachtařů od 10 do 25. Pro snížení objemu výčtu se omezíme na možnosti 10 , 15, 20, 25 (pokud se závěry získané pro související možnosti výrazně liší, provedeme dodatečný, upřesňující výpočet). Tedy: X= (Xi) = (2, 3, 4, 5) - počet jachet (i=1,2,3,4); B = (Bj) =(10, 15, 20, 25) - počet členů jachtařského klubu (j=1,2,3,4).

Abychom mohli začít hledat řešení, sestrojíme rozhodovací matici, jejíž prvky ukazují zisk při i-tém rozhodnutí s j-tým počtem členů jachtařského klubu:

aij = 100 min (5Xi ; Bj) - 170Xi - 730

těch. rozhodující pravidlo v našem problému je to formulováno jako „výnosy - náklady“.

Po provedení jednoduchých výpočtů vyplňte rozhodovací matici (aij) (viz Tabulka 15):

teorie herní matice řešení

Tabulka 15. Matice plateb

Například a11 = 100 min(52, 10) - 1702-730 = -70

a12=100min(52, 15)-1702-730=-70

a13 = a14 = -70 (poptávka po jachtách zůstane neuspokojena). Záporné hodnoty ukazují, že s těmito poměry poptávky po jachtách a jejich dostupnosti utrpí jachtařský klub ztráty.

Waldovo kritérium (volba opatrné, pesimistické strategie) - pro každou alternativu (počet jachet v klubu) je vybrána nejhorší situace ( nejmenší hodnotu výše zisku) a mezi nimi je nalezen zaručený maximální efekt:

ZMM=max(-70; -240; -410; -580)=-70

Závěr: při rozhodování podle Waldova kritéria by měl jachtařský klub zakoupit 2 jachty a maximální očekávaná ztráta nepřesáhne 70 CU.

Hurwitzovo kritérium (kompromisní řešení mezi nejhorším výsledkem a příliš optimistickým). Zvažme změnu v řešení našeho problému v závislosti na hodnotách koeficientu optimismu (v tabulce 16 jsou hodnoty, které splňují Hurwitzovo kritérium, zvýrazněny pro různé):

Tabulka 16. Hurwitzova řešení pro různé

Závěr: za 0,5 byste si měli koupit 5 jachet a očekávat zisk asi 170 rublů. (doufáme v širokou oblibu našeho klubu a určitou finanční životaschopnost amatérů), při = 0,2 bychom neměli kupovat více než 2 jachty (v našich prognózách jsme opatrnější a s největší pravděpodobností raději odmítneme vytvoření klub).

Savage kritérium (zjištění minimálního rizika). Při výběru řešení na základě tohoto kritéria je matice užitku nejprve porovnána s maticí lítosti D - pro náš příklad odečtením (-70) od prvního sloupce matice užitku, 260 od druhého sloupce, 590 a 920 ze třetího a čtvrtého sloupce získáme matici rizik (viz tabulka 17):

Tabulka 17. Matice rizik

Nejmenší hodnota mezi maximálními prvky řádku (zvýrazněné hodnoty v tabulce) se rovná:

ZS=min(990; 660; 340; 510)=340

Závěr: zakoupením 4 jachet pro jachtařský klub, který otevíráme, jsme si jisti, že v nejhorším případě ztráty klubu nepřekročí 340 CU.

Bayes-Laplaceovo rozhodovací kritérium. Předpokládejme, že existují statistická data, která nám umožňují odhadnout pravděpodobnost konkrétní poptávky po členství v jachtařském klubu: q=(0,1; 0,2; 0,4; 0,3). Poté matematické očekávání hodnoty zisku pro každou z uvažovaných variant řešení (zásoba jachet v yacht klubu):

a1r = (-700,1)+(-700,2)+(-700,4)+(-700,3) =-70,

a2r= (-2400,1)+(2600,2)+(2600,4)+(2600,3) =210;

a3r = 390; a4r = 370.

Závěr: v podmínkách uvažované situace je nejvhodnější zakoupit 4 jachty (v tomto případě bude maximální očekávaný zisk jachtařského klubu 390 peněžních jednotek).

Abychom mohli použít Laplaceovo kritérium, zjistíme:

a1r = ((-70)+(-70)+(-70)+(-70))/4 = -70;

a2r = ((-240)+(260)+(260)+(260))/4=135;

a3r = 215; a4r = 170.

Závěr: za podmínky stejné pravděpodobnosti výskytu té či oné poptávky po členství v jachtařském klubu byste si měli koupit 4 jachty a zároveň můžete počítat se ziskem 215 CU.

Obecný závěr. Uvažovaná kritéria vedou k různým rozhodnutím, a tím poskytují podněty k zamyšlení ( rozhodnutí zde bude výrazně záležet na psychologii a intuici subjektu rozhodování). To není překvapivé, protože kritéria jsou založena na různých hypotézách. Zavedením té či oné hypotézy o chování prostředí tím „odstraňujeme nejistotu“, ale samotná hypotéza je pouze předpoklad, nikoli znalost. Bylo by zvláštní, kdyby různé předpoklady vždy vedly ke stejnému výsledku.

Rozhodování pod rizikem

Jak bylo uvedeno výše, rozhodování za rizikových podmínek je charakteristické tím, že chování přírody (prostředí) je náhodné. To se projevuje tím, že existuje určitá pravděpodobnostní míra, podle které vznikají (nastávají) určité přírodní stavy. Zároveň obličej Dané řešení má určité informace o pravděpodobností výskytu stavů prostředí, které může být velmi různorodého charakteru. Například existují tři stavy prostředí B1, B2 a B3, další informace o výskytu těchto stavů pak může být taková, že stav B1 je nejméně pravděpodobný a stav B3 je pravděpodobnější.

Rozhodování za rizikových podmínek tedy kromě specifikace implementační funkce předpokládá i specifikaci některých dodatečné informace o pravděpodobnostech stavu životního prostředí. Je-li množina přírodních stavů B konečná (počet stavů je roven m), pak pravděpodobnostní míru na ní lze specifikovat vektorem pravděpodobnosti q=(q1, q2, …, qm), kde qj?0 a.

Výplatní matici za rizikových podmínek lze tedy prezentovat následovně (viz tabulka 1)

Stavy prostředí

Při výběru řešení Xi hráč ví, že obdrží jednu z výplat a11, ..., a1m s pravděpodobnostmi q1, ..., qm, resp. V důsledku toho je výsledkem pro rozhodovatele při výběru řešení Xi náhodná veličina

Porovnáním dvou řešení X1 a X2 tedy dojde k porovnání jejich odpovídajících náhodných proměnných.

Výběr optimálního řešení je obvykle založen na jednom z následujících kritérií:

  • 1) Bayes-Laplaceovo kritérium - očekávaná hodnota (zisk nebo náklad);
  • 2) kombinace očekávané hodnoty a rozptylu;
  • 3) produktové kritérium;
  • 4) nejpravděpodobnější událost v budoucnu a další.

Podívejme se blíže na Bayesovo-Laplaceovo kritérium.

Test očekávané hodnoty (Bayes-Laplaceův test)

V minulé přednášce jsme se podívali na Bayes-Laplaceovo kritérium. Použití tohoto kritéria (v literatuře lze nalézt jiný název - kritérium „očekávané průměrné hodnoty“) je dáno snahou maximalizovat očekávané zisky (nebo minimalizovat očekávané náklady). Použití očekávaných hodnot znamená možnost opakovaně řešit stejný problém, dokud nejsou získány dostatečně přesné hodnoty. kalkulační vzorce. Matematicky to vypadá takto: nechť o je náhodná veličina s matematickým očekáváním Mo a rozptylem Do. Pokud x1, x2,..., xn jsou hodnoty náhodná proměnná(s.v.) oh, pak aritmetický průměr jejich (střední hodnoty vzorku) hodnot

má rozptyl. Tedy, když n>

Jinými slovy, při dostatečně velkém vzorku má rozdíl mezi aritmetickým průměrem a matematickým očekáváním tendenci k nule (tzv. limitní věta teorie pravděpodobnosti). V důsledku toho je použití kritéria „očekávaná hodnota“ platné pouze v případě, kdy stejné řešení musí být aplikováno dostatečně často. Platí to i opačně: zaměření na očekávání povede k nesprávným výsledkům u rozhodnutí, která je třeba učinit několikrát.

Než přejdeme k úpravě Bayes-Laplaceova kritéria, podívejme se na toto kritérium podrobněji.

Je známo, že přirozenou numerickou charakteristikou náhodné veličiny o je její matematické očekávání Mo, ke kterému se průměrná hodnota této náhodné veličiny blíží ve velkém počtu testů.

Pokud má člověk, který se staví proti přírodě, statistické údaje o vzorcích v konkrétních projevech přírody, pak lze problém snadno vyřešit pomocí pravděpodobnostních metod.

Pokud jsou tedy pravděpodobnosti přírodních stavů známé a nemění se v čase (stacionární), pak řešení, které maximalizuje očekávaný zisk (které dává největší matematické očekávání zisku proti známé strategii přírody – stavu nebo podmínce) by mělo považovat za optimální.

Příklad. Společnost koupila stroj za 100 peněžních jednotek. Chcete-li jej opravit, můžete si zakoupit speciální vybavení za 50 jednotek. nebo se spokojit se starým vybavením. Pokud stroj selže, jeho oprava pomocí speciálního vybavení stojí 10 jednotek, bez speciálního vybavení - 40 jednotek. Je známo, že během své životnosti stroj selže ne více než třikrát: pravděpodobnost, že se stroj nerozbije, je 0,3; přestávky 1 krát - 0,4; přestávky 2 krát - 0,2; přestávky 3x - 0,1. Je nutné určit proveditelnost nákupu specializovaného opravárenského zařízení.

Formalizace. První hráč má dvě čisté strategie: kupovat (X1) a nekupovat (X2) specializované opravárenské vybavení. Příroda, druhý hráč, má čtyři stavy: stroj neselže, jednou selže, dvakrát se rozbije a třikrát se rozbije. Výplatní funkce jsou náklady společnosti na nákup a opravu stroje specifikované platební maticí (viz tabulka 1):

Stůl 1.

Porucha stroje

B1, nikdy

X1, nekupovat

X2, kup

Řešení. Podívejme se nejprve na tento problém jako na antagonistickou hru. Metodou minimax najdeme v matici sedlový bod: (X2, B4), cena hry je tedy v= - 180 peněžních jednotek (viz tabulka 2).

Tabulka 2

Porucha stroje

B1, nikdy

X1, nekupovat

X2, kup

Odpověď: musíte si koupit specializované vybavení.

Ve hrách s přírodou se však situace radikálně mění: podmínka již obsahuje stabilní smíšenou strategii přírody: q = (0,3; 0,4; 0,2; 0,1) a víme, že právě této strategie se příroda drží.

Pokud člověk - první hráč - pokračuje ve hře optimálně, pak jeho výplata bude M=-150Х0,3-160Ч0,4-170Ч0,2-180Ч0,1=-161, a pokud použije prvního, neoptimální strategie, pak jeho matematické očekávání výhry budou M=-100Х0,3 - 140Х0,4 - 180Х0,2 -220Х0,1 =-144.

Pro prvního hráče je tedy výhodné hrát neoptimálně!

Tabulka 3.

Porucha stroje

B1, nikdy

X1, nekupovat

X2, kup

Odpověď: Nekupujte specializované vybavení.

Významný rozdíl mezi hodnotami v(x*) a v(x") je vysvětlen tím, že smíšená strategie přírody není optimální a „odchýlením se“ od své optimální strategie „ztrácí“ 36 peněžní jednotky výher.

Takže ve hře s přírodou je orientace na matematické očekávání výhry vlastně orientací na průměrnou výhru, která se získá při mnohonásobném opakování této hry (za předpokladu, že se podmínky hry nezmění). Samozřejmě, pokud se hra skutečně mnohokrát opakuje, lze kritérium průměrného zisku (například v ekonomických problémech - průměrný zisk) považovat za oprávněné. Je však rozumné zaměřit se na toto kritérium v ​​jediném testu?

Zvažte následující příklad. Firma I může nabídnout k prodeji jedno ze zboží TI1 nebo TI2 a firma II může nabídnout zboží TII1, TII2, TII3. Zboží TI1 a TII1 je konkurenční (například pivo a limonáda) a zboží TI1 a TII3 je komplementární (například pivo a plotice); ostatní produkty jsou neutrální. Zisk firmy I závisí na kombinaci zboží nabízeného k prodeji oběma firmami a je určen tabulkou 4. Je známo, že firma II nabízí k prodeji produkt TII3 třikrát méně často než TII1 a čtyřikrát méně často než TII2 . Který produkt by měl být prodán firmě I?

Tabulka 4

Stavy prostředí

Zde je rozhodnutí dát k prodeji firmou I produkt TI1, rozhodnutí X2 dát k prodeji firmou I produkt TI2.

Spočítejme si matematická očekávání pro tuto tabulku:

M=8H3/8+18H4/8+40H1/8=17, M=18H3/8+15H4/8+14H1/8=16.

Optimální strategií bude řešení X1, tzn. Firma I dodává zboží do TI1. Výplata 17 peněžních jednotek je samozřejmě lepší než 16. Při volbě řešení X1 však nezískáme 17 peněžních jednotek, ale jednu z výher: 8, 18 nebo 40. Při volbě řešení X2 získáme nikoli 16 peněžních jednotek, ale jedna z výher je 18, 15 nebo 14. Sestavme si tabulku znázorňující odchylky možných výher od jejich očekávaných hodnot a pravděpodobnost těchto odchylek.

Tabulka 5. Hodnoty odchylek

Z této tabulky je vidět, že při stejných očekávaných výhrách vedou odchylky od očekávaných výher jinak: pro X1 jsou tyto odchylky významné a pro X2 jsou relativně malé.

Z analýzy můžeme vyvodit závěr: v podmínkách rizika není Bayes-Laplaceovo kritérium (očekávaný průměrný zisk) adekvátní a mělo by být změněno s ohledem na možné odchylky náhodná veličina z její průměrné hodnoty.

V teorii pravděpodobnosti se jako míra odchylky náhodné veličiny od její střední hodnoty obvykle používá rozptyl Do nebo směrodatná odchylka y=. V rozhodovacích problémech za rizikových podmínek budeme za ukazatel rizika považovat směrodatnou odchylku y, od r y má stejný rozměr jako náhodná veličina o, matematické očekávání Mo.

Pro rozhodování za rizikových podmínek tedy volba alternativy Xi vede k náhodné proměnné oi, kterou lze charakterizovat dvojicí indikátorů (Mo, уi). Nyní začněme konstruovat adekvátní kritérium pro srovnání alternativ. Ve skutečnosti zde dostáváme dvoukriteriální optimalizační problém, kde dílčími kritérii jsou matematické očekávání Mo (hodnotu tohoto kritéria je potřeba maximalizovat) a směrodatnou odchylku y (hodnotu tohoto kritéria je potřeba minimalizovat).

Zvažme nalezení Paretova optimálního řešení pro tento multikriteriální problém. Předpokládejme, že je nutné vybrat jedno optimální řešení z množiny proveditelných řešení, z nichž každé je určeno dvojicí ukazatelů (Moi, уi). Znázorněním bodů se souřadnicemi (Moi, уi) na souřadnicové rovině získáme obrázek typu na Obr. 1, tzn. dostali jsme prostor odhadů. Levá strana význam obrázku (červené tečky). matematické očekávání vzali jsme kladné a záporné hodnoty, protože Toto kritérium (y) musíme minimalizovat. Paretovy optimální odhady jsou správné horní limit a v souladu s tím Paretova optimální řešení X1, X2, X9 a X7.

V tomto příkladu je množina Pareto-optimálních řešení X1, X2, X9, X7 a konečný výběr optimálního řešení je proveden z této množiny. Jak již bylo zmíněno výše, existují dva přístupy: první přístup spočívá v tom, že se zkonstruuje sada Pareto-optimálních řešení az této sady si osoba s rozhodovací pravomocí vybere jedinečné řešení na základě neformálních dodatečných úvah. Uvažujme druhý přístup založený na zúžení množiny Pareto-optimálních alternativ.

  • 1. Výběr hlavního kritéria a přiřazení spodních mezí pro další kritéria. Přiřaďme dolní mez podle kritéria M a minimalizujme kritérium y. Jako spodní hranici kritéria M vezmeme hodnotu M4 (viz obr. 1), optimální řešení pak bude X2, takže mezi řešení splňující podmínku Mi? M4, to je nejméně rizikové.
  • 2. Lexikografická optimalizace zahrnuje seřazení kritérií podle důležitosti. Nechť je například M nejdůležitějším kritériem. Protože jediné řešení X7 má maximální hodnotu podle kritéria M, je optimální. To jasně ukazuje nevýhodu metody lexikografické optimalizace: zohlednění jednoho (nejdůležitějšího) kritéria. Tato nevýhoda je spojena s potřebou zavést přísnou prioritu kritérií a lze ji odstranit oslabením „rigidity“ priorit. V tomto případě se používá metoda postupných ústupků (metoda změny cíle), která byla diskutována výše.

Například v našem případě, jako ústupek podle kritéria M, hodnota D uvedená na Obr. 1. Pak výsledkem volby v prvním kroku budou alternativy X7, X8, X9. Mezi nimi bude nejlepší podle druhého kritéria X9. Mírným snížením požadavků na kritérium M jsme tedy výrazně zlepšili hodnocení pro kritérium y (tj. mírné snížení očekávaného zisku vedlo k výraznému snížení rizika).


Rýže. 1.

Zvažme použití zobecněného kritéria pro náš problém. Vezměme jako zobecněné kritérium funkci formuláře:

f(M, y)= M-lChu, (1)

kde l je nějaká konstantní hodnota. Kritérium (1) totiž představuje aditivní kritérium optimality pro dílčí kritéria M, y s váhovými koeficienty 1 a -l. Když n>0, odhad náhodné veličiny pomocí aditivního kritéria (1) je menší než její průměrná hodnota, která je typická pro opatrný člověk, tj. člověk averze k riziku. Naopak, když l<0 оценка (1) выше, чем среднее значение, что характеризует человека, склонного к риску. Наконец, при л=0 оценка случайной величины совпадает с её средним значением (т.е. возможные отклонения случайной величины от её среднего значения игнорируются) - это характеризует человека, безразличного к риску.

Věcný význam aditivního kritéria (1) pro n>0 je ten, že ke zvýšení kritéria f(M, y) může dojít jak v důsledku zvýšení M, tak v důsledku snížení y. Kritérium (1) tedy pro osobu averze k riziku odráží touhu zvýšit očekávaný zisk a snížit riziko odchylky od něj. V tomto případě indikátor l charakterizuje subjektivní postoj rozhodovatele k riziku. Proto lze l považovat za subjektivní ukazatel míry averze k riziku (subjektivní ukazatel opatrnosti).

Výběr varianty vyráběného produktu. Společnost může vyrábět produkty z těchto šesti typů: deštníky (Z), bundy (K), pláštěnky (P), tašky (S), boty (T) a (W). Šéf firmy se musí rozhodnout, který z těchto typů produktů bude v nadcházející letní sezóně vyrábět. Zisk společnosti závisí na tom, jaké bude léto - deštivé, horké nebo mírné, a určuje se podle tabulky 6. Která varianta výroby bude optimální?

Při absenci dalších informací o stavech prostředí za podmínek nejistoty je jeho řešení možné přijetím jakékoliv hypotézy o chování prostředí. Pokud má osoba s rozhodovací pravomocí informace o pravděpodobností deštivého, horkého a mírného léta, pak se specifikovaný problém stává problémem rozhodování o riziku. Potřebné informace lze v tomto případě čerpat ze statistických údajů (pozorování počasí v dané oblasti). Předpokládejme, že pravděpodobnost deštivého, horkého a mírného léta je 0,2, 0,5 a 0,3. Pak se dostáváme k problému rozhodování za rizikových podmínek, daný tabulkou 7.

Tabulka 6.

Najděte očekávané výnosy odpovídající řešením Z, K, P, S, T, W. Máme:

MZ=0,2H80+0,5H60+0,3H40=58,

Mk=0,2H70+0,5H40+0,3H80=58,

MP=0,2H70+0,5H50+0,3H60=57,

MS=0,2H50+0,5H50+0,3H70=56,

MT=0,2H75+0,5H50+0,3H50=55,

DoZ=196, DoK=336, DoP=61, DoC=84, DoT=100, DoSh=231,5. Směrodatné odchylky uvažované náhodné proměnné jsou:

yZ=14,0, yK=18,3, yP=7,8, yS=9,2, yT=10,0, ySh=15,2.

Udělejme tabulku hodnot kritérií M a y pro každou alternativu (tabulka 8)

tabulka 8

Kritéria

Znázorněme uvažovaná řešení jako body na souřadnicové rovině proměnných M a y a dostaneme Obr. 2, ze kterého jsou Pareto-optimální řešení Z, P, Sh. Z této množiny je třeba provést konečnou volbu optimální alternativy.

Zúžení Pareto-optimální množiny (ideálně na jeden prvek) lze provést pouze v případě, že existují další informace o vztahu mezi kritérii M a y. Jak již bylo uvedeno výše, lze to provést metodou hlavního kritéria, metodou postupných ústupků nebo pomocí lexikografického kritéria.

Přezkoumání rozhodovacích kritérií za rizikových podmínek

Pracovní kritérium

Pravidlo výběru je v tomto případě formulováno takto:

Rozhodovací matice je doplněna o nový sloupec obsahující součiny všech výsledků každého řádku. Jsou vybrány ty možnosti, jejichž řádky obsahují nejvyšší hodnoty tento sloupec.

Použití tohoto kritéria je způsobeno následujícími okolnostmi:

  • · pravděpodobnosti výskytu stavu Bj nejsou známy;
  • · je třeba vzít v úvahu vzhled každého ze stavů Bj zvlášť;
  • · kritérium platí i pro malý počet implementací řešení;
  • · určité riziko je přijatelné.

Kritérium produktu je přizpůsobeno především pro případy, kdy jsou všechny aij kladné. Pokud je podmínka pozitivity porušena, měl by být proveden posun aij+a s nějakou konstantou a>. Výsledek bude přirozeně záviset na a. V praxi nejčastěji

Pokud nelze uznat význam žádné konstanty, pak se kritérium součinu nepoužije.

Předchozí Domů Další

Rozhodování za rizikových podmínek s možností provedení experimentu

Při rozhodování v podmínkách nejistoty (nebo v podmínkách rizika) vzniká zásadní obtíž při volbě řešení z důvodu neznalosti toho, kdo rozhoduje o skutečném stavu prostředí. V předchozích přednáškách bylo zvažováno několik kritérií, z nichž každé „bojuje“ s nejistotou svým vlastním způsobem: předložením hypotézy o chování prostředí (kritérium Laplace, Wald, Hurwitz a Savage); zprůměrováním výsledných zisků (Bayes-Laplaceovo kritérium nebo kritérium očekávaného zisku); zohledněním jak očekávaného zisku, tak míry odchylky od něj. Každý z těchto přístupů však poskytuje pouze způsob, jak racionálně analyzovat nejistotu, aniž by eliminoval nejistotu samotnou. Odstranění nebo alespoň snížení nejistoty lze provést pouze na základě vyjasnění skutečného stavu životního prostředí.

V praxi se takové objasňování provádí zpravidla sběrem dalších informací a prováděním experimentů, jejichž výsledky slouží k posouzení aktuálního stavu životního prostředí. Například před zahájením léčby pacienta s nejasnou diagnózou lékař provádí dodatečné testy; Před vrtáním drahého ropného vrtu provede geolog seismický průzkum; Před zahájením výroby jakéhokoli výrobku zhotoví podnikatel zkušební šarži tohoto výrobku atd. V rámci teorie rozhodování neznamenají všechny tyto akce nic jiného než provedení experimentu za účelem objasnění stavu životního prostředí.

Experiment se nazývá ideální, pokud na základě jeho výsledků osoba s rozhodovací pravomocí rozpozná skutečný stav prostředí. V praxi je dokonalý experiment poměrně vzácný. Nejčastěji výsledek experimentu poskytuje nějakou informaci, na základě které lze prostředí objasnit.

Jak využít výsledky experimentu a dostupná statistická data při rozhodování co nejefektivněji? Jedna z metod řešení tohoto problému je založena na Bayesově vzorci – vzorci pro přehodnocení pravděpodobností událostí s přihlédnutím k výsledkům experimentu.

Všimněte si, že experiment není možný pro každý problém rozhodování. Pokud je pro určitý úkol možný experiment, pak vyvstává úkol posoudit proveditelnost jeho realizace. Faktem je, že provedení experimentu vždy vyžaduje náklady (materiálové, organizační, časové atd.).

[Rosen] ukazuje, že ideální experiment je ziskový právě tehdy, když jsou jeho náklady nižší než minimální očekávané riziko:

kde rij jsou rizika, C je cena experimentu.

Abychom představili Bayesovský přístup k přehodnocení pravděpodobností, připomeňme si některé pojmy z teorie pravděpodobnosti.

Podmíněná pravděpodobnost události A za předpokladu, že nastala událost B, se označí P(A/B) a vypočítá se podle vzorce

Uvažujme následující pravděpodobnostně teoretické schéma. Nechť B1, B2, …, Bm je úplná skupina jevů a pro každý jev Bj platí j= jeho pravděpodobnost P(Bj). Nechť se provede experiment, v jehož důsledku došlo k jevu A. Pokud jsou známy podmíněné pravděpodobnosti P(A/Bj) pro všechna j=, pak podmíněná pravděpodobnost (poexperimentální) pravděpodobnosti jevu Bj (j=, ) lze nalézt pomocí Bayesova vzorce

Podívejme se nyní schematicky na problém rozhodování za rizikových podmínek, specifikovaný pomocí výplatní matice, která má formulářovou tabulku.

Tabulka 1. Platební matice s pravděpodobnostním vektorem stavu prostředí

Stavy prostředí

Zde B1, B2, …, Bm jsou stavy prostředí, aij je odměna hráče v situaci, kdy zvolí strategii Xi, a prostředí nabývá stavu Bj. Osoba s rozhodovací pravomocí zná pravděpodobnost P(Bj)= qj výskytu stavu Bj, a P(Bj)?0 a. Předpokládá se, že médium může být v jednom a pouze jednom ze stavů B1, B2, ..., Bm. Jinými slovy, náhodné události B1, B2, ..., Bm tvoří ucelenou skupinu událostí, takže je lze brát jako hypotézy. Pravděpodobnosti stavů prostředí známé rozhodovateli P(Bj) (j=) jsou nepodmíněné (předexperimentální, apriorní) pravděpodobnosti.

Předpokládejme, že se provádí nějaký experiment, jehož výsledek nějak závisí na stávajícím stavu prostředí. Pokud je jako výsledek experimentu pozorován jev A a navíc jsou známy podmíněné pravděpodobnosti P(A/Bj) pro všechna j=, pak pomocí Bayesova vzorce lze najít poexperimentální (posteriorní) pravděpodobnosti každého stavu prostředí. Znalost rafinovaných pravděpodobností stavů prostředí umožňuje přesněji specifikovat strategii rozhodovatele.

Popsaný přístup k rozhodování pod rizikem se nazývá Bayesovský, protože je založen na Bayesově vzorci. Tento přístup je ilustrován níže uvedeným příkladem.

Úkol. Vrtání ropného vrtu.

Vedoucí vyhledávací skupiny se musí rozhodnout: vyvrtat ropný vrt nebo ne. Studna se může ukázat jako „suchá“ (C), tzn. bez oleje, „low-power“ (M), tzn. s nízkým obsahem oleje a „bohaté“ (B), tj. s vysokým obsahem oleje. Alternativy vedoucího skupiny jsou: x1 - vrtat a x2 - nevrtat. Čistý zisk při výběru jedné z alternativ v závislosti na možném typu vrtu je uveden v tabulce zisku (viz tabulka 1)

Tabulka 1. Matice plateb

No typ

Kromě toho vedoucí vyhledávací skupiny ví, že v dané oblasti jsou pravděpodobnosti suché, tenké nebo bohaté studny následující: P(C)=0,5, P(M)=0,3, P(B)=0,2.

Vedoucí vyhledávací skupiny může provést experiment k objasnění struktury půdy (stavu prostředí). Tento experiment je seismický průzkum, jehož výsledkem bude odpověď – jaká je struktura půdy v dané oblasti (nikoli však odpověď na otázku o typu studny!). V zásadě může být struktura půdy buď otevřená (O) nebo uzavřená (C). Vedoucí skupiny má k dispozici tabulku výsledků pokusů uvedených v této oblasti (viz tabulka 2).

Tabulka 2. Tabulka experimentálních dat

Tato tabulka ukazuje, kolikrát byly studny typu C, M, B nalezeny na půdách s otevřenou a uzavřenou strukturou (tj. poskytuje společnou statistiku půdy a typu studní pro danou oblast).

Analyzujme experimentální data výsledné tabulky. Předpokládejme, že bylo provedeno n experimentů, jejichž výsledkem jsou hodnoty diskrétních náhodných veličin X (typ studny) a Y (struktura půdy), které nabývají hodnot C, M, B a O, Z. Označme n11 počet pokusů, ve kterých X = C a Y=O, za n12 počet pokusů, ve kterých X=C a Y=Z, za n21 počet pokusů, ve kterých X=M a Y=O atd. V našem případě n=100, n11=45, n12=5, n21=11. Vydělením hodnot v tabulce 2 číslem 100 (podle počtu provedených experimentů) získáme distribuční zákon dvourozměrné náhodné veličiny (X, Y) uvedené v tabulkové formě (viz tabulka 3).

Tabulka 3. Statistická řada rozvod dvourozměrných r.v. (X, Y)

Z tabulky 3 vyplývá, že P(X=C)=P(C)=0,5, P(X=M)=P(M)=0,3, P(X=B)=P(B)=0,2; Р(Y=O)=P(O)=0,6, Р(Y=З)=P(З)=0,4,

Vedoucí skupiny tedy musí rozhodnout:

  • · zda provést experiment (jeho cena je 10 jednotek);
  • · pokud se provádí, co dělat v budoucnu v závislosti na výsledcích experimentu.

Tak byl získán vícestupňový problém rozhodování za rizikových podmínek. Pojďme si popsat způsob hledání optimálního řešení.

Krok 1. Postavme strom (obr. 1), který označuje všechny fáze rozhodovacího procesu - rozhodovací strom. Větve stromu odpovídají možným alternativám a vrcholy odpovídají vznikajícím situacím. Alternativy vedoucího vyhledávací skupiny jsou: b - odmítnutí pokusu, c - provedení pokusu, x1 - cvičení, x2 - necvičení. Přírodní stavy: volba typu studny (C, M, B), jakož i volba struktury půdy (O, W).

Postavený strom určuje hru vedoucího skupiny s přírodou. Pozice této hry jsou vrcholy stromu a tahy hráčů jsou řešení, která volí. Pozice, ve kterých vedoucí skupiny provádí pohyb, jsou znázorněny obdélníkem; pozice, ve kterých se příroda pohybuje, jsou zakroužkovány.

Hra probíhá následovně. Ve výchozí pozici provádí tah vedoucí skupiny. Musí se rozhodnout - odmítnout pokus (zvolit řešení b) nebo pokus provést (zvolit řešení c). Pokud experiment opustil, hra se přesune na další pozici, ve které se vedoucí skupiny musí rozhodnout: vrtat (zvolte alternativu x1) nebo nevrtat (zvolit alternativu x2). Pokud se rozhodne provést experiment, pak se hra přesune do polohy, ve které se příroda pohybuje, přičemž zvolí jeden ze stavů O nebo Z, odpovídající možné výsledky experiment atd. Hra končí, když dosáhne konečné pozice (tj. vrchol stromu, pro který z něj nevycházejí žádné větve)

Krok 2. Pro každé rozhodnutí, které je přirozeným pohybem (tj. pochází z pozice znázorněné kroužkem), potřebujeme najít pravděpodobnost tohoto pohybu. K tomu postupujeme následovně. Pro každou pozici stromu existuje jediná cesta spojující tuto pozici s výchozí pozicí. Pokud je to pro polohu přírody, cesta spojující ji s výchozí polohou neprochází polohou (E), myšleno experiment, pak pravděpodobnosti stavů P(S), P(M) a P(B) ) jsou nepodmíněné (předexperimentální) a jsou ze stolu. 3:

P(S)=50/100, P(M)=30/100, P(B)=20/100.

Pokud pro polohu přírody prochází dráha spojující ji s výchozí polohou polohou (E), pak se pravděpodobnosti stavů prostředí stanou podmíněnými pravděpodobnostmi a zjistí se podle vzorců (1) pomocí údajů v tab. . 3:

V pozici (E) jsou pravděpodobnosti tahů vedoucích do pozic (O) a (W) zjištěny z tabulky 3: P(O)=0,6, P(Z)=0,4.


Rýže. 1.

Krok 3. Vyhodnoťme všechny pozice herního stromu, „sestupně“ z konečných pozic na počáteční. Hodnocení pozice je očekávaná výhra v této pozici. Odhady pro konečné pozice najdeme z tabulky 2. Nyní naznačíme metodu pro nalezení odhadu pro libovolnou pozici herního stromu za předpokladu, že odhady pro všechny následující pozice již byly nalezeny.

Pro postavení přírody představuje její hodnocení očekávaný zisk (viz obrázek 2);

Pro pozici hráče je odhadem maximum ze všech pozic za ní. Motiv: ve „své“ pozici může hráč provést libovolný tah, vybere si tedy ten, který vede k největší možné výhře (viz obrázek 3). Na každé pozici hráč označí pomlčkou větev stromu, která vede k pozici s maximálním skóre.


Vraťme se k Obr. 1. Zjistíme, že v počáteční pozici je očekávaný zisk bez provedení experimentu (alternativa b) 20 jednotek; očekávaný zisk s experimentem (alternativa c) je 28 jednotek. Vhodným řešením je tedy provedení experimentu (seismický průzkum). Dále, pokud experiment ukazuje, že půda je otevřená, pak by se nemělo provádět vrtání, ale pokud je uzavřeno, mělo by se vrtat.

  • 1 - větev: =20
  • 2 - větev: 0
  • 3 - větev:= -30
  • 4 - větev: 0
  • 5 - větev: =95
  • 6 - větev: 0

Jak vyplývá z podmínek úlohy, můžeme získat hodnotu 95 jednotek s pravděpodobností 0,4. Očekávané výhry tedy budou 0,4*95=38 jednotek. Odečteme náklady na experiment rovnající se 10 jednotkám.

Výsledkem je 28 jednotek.

Rozhodovací stromy hierarchicky představují logickou strukturu rozhodování a usnadňují tak pochopení problému a procesu jeho řešení. Na rozdíl od rozhodovací matice zde vidíte časový průběh rozhodovacího procesu. Rozhodovací strom však nemůže být obecně reprezentován jednoduchou rozhodovací maticí; Takto lze znázornit pouze jednotlivé fáze procesu. Rozdělení na etapy se provádí tak, že volba řešení začíná určitým rozhodovacím uzlem, ze kterého vychází jedna nebo více větví představujících možnosti řešení. Poté následují uzly událostí a na konci - listy" představující konečné stavy udávající hodnoty odpovídajících výstupních parametrů. Pokud za uzly událostí opět následuje rozhodovací uzel s odpovídajícími akcemi, pak tento a všechny následující větve se týkají více pozdní fáze výběr řešení. Můžete tak sledovat celou cestu od začátku až do konce rozhodovacího stromu.

Rozhodovací strom rozlišuje mezi uzly událostí a rozhodovacími uzly. Lze si představit, že v uzlech událostí se určuje výběr další cesty vnější podmínky(podle povahy, v teorii her soupeřem) a v rozhodovacích uzlech rozhodovatelem.

Rozhodovací stromy lze snadno modifikovat: v případě potřeby je lze dále rozvíjet a v případech, kdy některé větve prakticky nemají smysl, lze je odpovídajícím způsobem zmenšit. Rozhodovací uzly, pokud jsou spojeny s jednou akcí a nejsou odděleny uzly událostí, lze kombinovat. Totéž platí pro uzly událostí.



Novinka na webu

>

Nejoblíbenější