Dom Higijena Stručne procjene minimaks metode i Bayes-Laplaceove i Savage metode. Pogledajte stranice na kojima se spominje pojam Bayesov kriterij

Stručne procjene minimaks metode i Bayes-Laplaceove i Savage metode. Pogledajte stranice na kojima se spominje pojam Bayesov kriterij

Vježbajte. Kompanija planira da prodaje svoje proizvode na tržištima, uzimajući u obzir moguće opcije za potražnju potrošača P j , j = 1,4 (niska, srednja, visoka, vrlo visoka). Kompanija je razvila tri strategije prodaje robe A 1, A 2, A 3. Obim prometa (novčane jedinice), u zavisnosti od strategije i potražnje potrošača, prikazan je u tabeli.
P 1P 2P 3P 4
A 130+N10 20 25 + N/2
A 250 70 - N10 + N/225
A 325 – N/235 40 60 - N/2
gdje je N=3
Moguća stanja potražnje potrošača su poznata, a to su q 1 =0,3, q 2 =0,2, q 3 =0,4, q 4 =0,1. Potrebno je pronaći prodajnu strategiju koja maksimizira prosječan promet kompanije. U ovom slučaju koristite kriterije Walda, Hurwitza, Savagea i Bayesa.

Rješenje pronađite pomoću kalkulatora.
Bayesov kriterijum.
Prema Bayesovom kriteriju, strategija (čista) A i koja maksimizira prosječni dobitak a ili minimizira prosječni rizik r se prihvata kao optimalna.
Računamo vrijednosti ∑(a ij p j)
∑(a 1,j p j) = 33 0,3 + 10 0,2 + 20 0,4 + 26,5 0,1 = 22,55
∑(a 2,j p j) = 50 0,3 + 67 0,2 + 11,5 0,4 + 25 0,1 = 35,5
∑(a 3,j p j) = 23,5 0,3 + 35 0,2 + 40 0,4 + 58,5 0,1 = 35,9

A iP 1P 2P 3P 4∑(a ij p j)
A 1 9.9 2 8 2.65 22.55
A 2 15 13.4 4.6 2.5 35.5
A 3 7.05 7 16 5.85 35.9
p j 0.3 0.2 0.4 0.1

Laplaceov kriterijum.
Ako su vjerovatnoće stanja prirode uvjerljive, za njihovu procjenu koristi se Laplaceov princip nedovoljnog razloga, prema kojem se pretpostavlja da su sva prirodna stanja jednako vjerovatna, tj.
q 1 = q 2 = ... = q n = 1/n.
q i = 1/4
A iP 1P 2P 3P 4∑(a ij)
A 1 8.25 2.5 5 6.63 22.38
A 2 12.5 16.75 2.88 6.25 38.38
A 3 5.88 8.75 10 14.63 39.25
p j 0.25 0.25 0.25 0.25
Zaključak: izabrati strategiju N=3.
Waldov kriterij.
Prema Valdovom kriterijumu, za optimalnu se uzima čista strategija, koja u najgorim uslovima garantuje maksimalan dobitak, tj.
a = max(min a ij)
Waldov kriterijum fokusira statistiku na najnepovoljnija stanja prirode, tj. ovaj kriterijum izražava pesimističnu ocjenu situacije.
A iP 1P 2P 3P 4min(a ij)
A 1 33 10 20 26.5 10
A 2 50 67 11.5 25 11.5
A 3 23.5 35 40 58.5 23.5
Zaključak: izabrati strategiju N=3.
Kriterijum divljaka.
Savageov kriterij minimalnog rizika preporučuje odabir optimalna strategija onaj u kojem je veličina maksimalnog rizika minimizirana pod najgorim uslovima, tj. pod uvjetom:
a = min(max r ij)
Savageov kriterijum fokusira statistiku na najnepovoljnija stanja prirode, tj. ovaj kriterijum izražava pesimističnu ocjenu situacije.
Pronalazimo matricu rizika.
Rizik– mjera neslaganja između različitih mogućih ishoda usvajanja određenih strategija. Maksimalni dobitak u j-toj koloni b j = max(a ij) karakterizira povoljno prirodno stanje.
1. Izračunajte 1. stupac matrice rizika.
r 11 = 50 - 33 = 17; r 21 = 50 - 50 = 0; r 31 = 50 - 23,5 = 26,5;
2. Izračunajte 2. stupac matrice rizika.
r 12 = 67 - 10 = 57; r 22 = 67 - 67 = 0; r 32 = 67 - 35 = 32;
3. Izračunajte 3. stupac matrice rizika.
r 13 = 40 - 20 = 20; r 23 = 40 - 11,5 = 28,5; r 33 = 40 - 40 = 0;
4. Izračunajte 4. stupac matrice rizika.
r 14 = 58,5 - 26,5 = 32; r 24 = 58,5 - 25 = 33,5; r 34 = 58,5 - 58,5 = 0;
A iP 1P 2P 3P 4
A 1 17 57 20 32
A 2 0 0 28.5 33.5
A 3 26.5 32 0 0

A iP 1P 2P 3P 4max(a ij)
A 1 17 57 20 32 57
A 2 0 0 28.5 33.5 33.5
A 3 26.5 32 0 0 32
Zaključak: izabrati strategiju N=3.
Hurwitzov kriterijum.
Hurwitzov kriterij je kriterij pesimizma – optimizma. Za optimalnu strategiju se uzima ona za koju vrijedi sljedeća relacija:
max(s i)
gdje je s i = y min(a ij) + (1-y)max(a ij)
Kod y = 1 dobijamo Waldeov kriterijum, kod y = 0 dobijamo optimistički kriterijum (maksimaks).
Hurwitzov kriterij uzima u obzir mogućnost i najgoreg i najboljeg ponašanja prirode za ljude. Kako ste izabrani? Kako gore posledice pogrešnih odluka, što je veća želja za osiguranjem od grešaka, to je y bliže 1.
Računamo s i.
s 1 = 0,5 10+(1-0,5) 33 = 21,5
s 2 = 0,5 11,5+(1-0,5) 67 = 39,25
s 3 = 0,5 23,5+(1-0,5) 58,5 = 41
A iP 1P 2P 3P 4min(a ij)max(a ij)y min(a ij) + (1-y)max(a ij)
A 1 33 10 20 26.5 10 33 21.5
A 2 50 67 11.5 25 11.5 67 39.25
A 3 23.5 35 40 58.5 23.5 58.5 41
Zaključak: izabrati strategiju N=3.
Dakle, kao rezultat odluke statistička igra Prema različitim kriterijumima, strategija A 3 se preporučivala češće od ostalih.

Menadžment kompanije odlučuje da locira proizvodnju novog proizvoda na određenoj lokaciji. Da bi se stekla predstava o stanju na tržištu novog proizvoda u trenutku ovladavanja proizvodnjom, potrebno je uzeti u obzir troškove isporuke gotovih proizvoda potrošaču, razvoj prometne i društvene infrastrukture. region, konkurencija na tržištu, odnos ponude i potražnje, devizni kurs i još mnogo toga. Moguće opcije odluke, čija je investiciona atraktivnost definisana kao procenat rasta prihoda u odnosu na iznos kapitalnih ulaganja, prikazane su u tabeli.
Odaberite:
1) mesto za lociranje proizvodnje, ako je rukovodilac preduzeća uveren da će se situacija 4 razviti na tržištu;
2) mesto za lociranje proizvodnje ako rukovodstvo proceni verovatnoću situacije 1 na 0,2; situacije 2 u 0,1; situacija 3 na 0,25;
3) izabrati opciju u uslovima neizvesnosti prema kriterijumu: maximax, maximin, Laplaceov kriterijum, Savage kriterijum, Hurwitz kriterijum (y = 0,3);
4) da li će se promeniti najbolja opcija rješenja prema Hurwitz-ovom kriteriju ako se vrijednost a poveća na 0,5?
5) pod pretpostavkom da podaci tabele predstavljaju troškove preduzeća, odrediti izbor koji će preduzeće napraviti kada koristi svaki od sledeći kriterijumi: maximin; maximax; Hurwitzov kriterijum(? = 0,3); Kriterijum divljaka; Laplaceov kriterijum

Pretpostavlja se da su depoziti ravnomjerno raspoređeni po cijeloj teritoriji. Ovakav pristup se teško može smatrati legitimnim, budući da zaključci dobijeni uz njegovu pomoć nemaju logičku osnovu. Međutim, Bayes-Laplaceov kriterij nije ništa proizvoljniji od Hurwitzovog kriterija.


Optimistički pristup, pristupi zasnovani na Hurwitzovom kriteriju, Bayes-Laplaceovom kriteriju i kriteriju Savage imaju u u ovom slučaju sljedeći pogled

Bajesov (Laplasov) kriterijum 27, 224 Bajesov pristup 27 Ravnoteža 27 Balans (ili ravnoteža)

Među ovim kriterijima i pravilima posebno mjesto zauzimaju pravila i kriteriji zasnovani na poznatoj Bayesovoj teoremi. Pristup zasnovan na ovoj teoremi omogućava, prvo, korištenje nekih metodoloških principa prirodnih nauka u upravljanju, i drugo, da se osigura da se prosuđivanje i donošenje odluka prilagođavaju kako se iskustvo stiče. Ovo drugo znači učenje upravljanja (u smislu donošenja odluka) u samom procesu upravljanja 1.

Ponekad se tokom operacije nesigurnost otkriva postepeno kako informacije postaju dostupne. U ovom slučaju, da bi se opravdale odluke, prikladno je koristiti takav objektivni kriterij kao što je posteriorna vjerovatnoća događaja. Ova vjerovatnoća se najlakše izračunava korištenjem Bayesove formule u smislu šansi. Hajde da razmotrimo suštinu ovog pristupa.

Bayesov kriterij se koristi u slučajevima kada je poznata raspodjela vjerovatnoće mogućih stanja. Ako je ova diskretna distribucija vjerovatnoće data skupom vjerovatnoća , tada je prema Bayesovom kriteriju strategija Si poželjnija od Sj (s > ako

Posebni slučajevi ovog kriterija su Bayesov kriterij (za A = 1) i Waldov kriterij (za A = 0).

Bayes-Laplaceov kriterij, za razliku od Waldovog kriterija, uzima u obzir svaku od mogućih posljedica svih opcija odluke

Bayes-Laplaceov kriterij postavlja sljedeće zahtjeve na situaciju u kojoj se donosi odluka:

Kada je z = 1, kriterij se transformira u Bayes-Laplaceov kriterij, a kada je z = O pretvara se u Waldov kriterij. Dakle, izbor z parametra podleže subjektivnosti. Osim toga, broj implementacija ostaje bez nadzora. Stoga se ovaj kriterij rijetko koristi pri donošenju tehničkih odluka.

Ispitali smo nekoliko osnovnih pristupa donošenju odluka u slučaju neizvjesnih faktora u modelu koji se proučava. Možete navesti primjere kada svi kriteriji odlučivanja dovode do izbora istog rješenja x e X, ali to se obično ne dogodi, svaki kriterij vodi do vlastite odluke (primjer ove vrste je razmatran u sljedećem poglavlju). Stoga se otvaraju rasprave o tome koji je kriterij poželjniji i kada. pokušavaju se konstruisati jedinstveni na osnovu više kriterijuma. Konkretno, Hurwitzov kriterij je takva kombinacija dva kriterija. Pokušali su i kombinirati Hurvtzov i Bayes-Laplaceov kriterij. Svi rezultujući kriterijumi imaju visok stepen proizvoljnosti. Po našem mišljenju, jedini način da se ove poteškoće prevaziđu je višekriterijumski pristup, u kojem donosilac odluke može razmotriti opcije za donošenje odluke koje su efikasne sa stanovišta skupa indikatora i izabrati najprikladniji jedan među njima. Ovaj pristup se koristi u primjeru datom u sljedećem poglavlju. Naravno, ukupnost indikatora ne bi trebala biti prevelika.

Obično se isprobava nekoliko konfiguracija drugačiji broj elementi i struktura veza. Jedan od mnogih važni pokazatelji su obim seta za obuku i osiguravanje sposobnosti generalizacije tokom daljeg rada, a željeni rezultat se može postići na razne šeme. Najčešće korištene procedure su sekvencijalno spuštanje (sa potvrdnim skupom) ili N-struka unakrsna validacija. Moćniji kriterijumi informacija se takođe mogu primeniti (1) generalizovana unakrsna validacija (GV), konačna greška predviđanja Akaike (FPE), Bayes kriterijumi (BI) i Akaike kriterijumi (AI) (vidi ). Da bi se poboljšale sposobnosti generalizacije i eliminisala opasnost od prekomerne opreme, takođe se koriste smanjenje težine i eliminacija (proređivanje stabala). Istovremeno se mijenja arhitektura mreže, uklanjaju se neke veze i proučava se njihov utjecaj na efikasnost. >,

BAYES (LAPLACE) KRITERIJ – u teoriji odlučivanja, kriterij za donošenje odluka u nedostatku bilo kakvih informacija o relativnim vjerovatnoćama „prirodnih“ strategija. (Vidi Neizvjesni problemi.) Prema B.(L.)k. Predlaže se da se svim strategijama koje se razmatraju daju jednake vjerovatnoće, a zatim se prihvati ona sa najvećom očekivanom isplatom. Nedostatak je što raspon evaluiranih alternativa u istom problemu može biti različit i, shodno tome, relativna vjerovatnoća svake od njih također može biti različita.

Hodges-Lehman kriterij. Prilikom implementacije ovog kriterija koriste se dva subjektivna indikatora: prvo, raspodjela vjerovatnoće korištena u Bayesovom kriteriju, i drugo, „parametar optimizma“ iz Hurwitzovog kriterija

Hodge-Lehman kriterijum se istovremeno zasniva na Wald i Bayes-Laplaceovom kriterijumu

Prilikom traženja optimalnih rješenja najčešće koriste raznim kriterijumima, dajući neku šemu donošenja odluka. Pogledajmo neke od njih.

Bayesov kriterijum. Kada se koristi Bayesov kriterijum, statističar zna vjerovatnoće q k za pojavu događaja P k. Obično se vjerovatnoće q k određuju provođenjem eksperimenata. Takve vjerovatnoće se nazivaju posteriorne. Čista strategija je prihvaćena kao optimalna prema Bayesovom kriteriju A i, pri čemu prosječna pobjednička statistika postaje maksimalna.

Laplaceov kriterijum. Laplasov kriterijum se razlikuje od Bayesovog kriterijuma po tome što su aposteriorne verovatnoće nepoznate. Zatim se uzimaju jednake i izračunavaju pomoću formule

Kriterijum divljaka. Ovaj kriterijum je kriterijum ekstremnog pesimizma, tj. statističar polazi od pretpostavke da priroda deluje protiv njega na najgori mogući način. Kriterijum Savage preporučuje da se kao optimalna odabere ona čista strategija A i kod koje je maksimalni rizik minimalan. Ovaj rizik se naziva minimalnim i izračunava se po formuli

Waldov kriterij. Kao i kriterij Savage, i Waldov kriterij je kriterij ekstremnog pesimizma. Stoga, statističar bira čistu strategiju A tako da će najmanja isplata biti maksimalna. Ovaj dobitak se naziva maksimin i izračunava se po formuli

Hurwitzov kriterijum. Ovaj kriterij je kriterij pesimizma-optimizma i preporučuje korištenje nečega između. U ovom slučaju, statističar bira čistu strategiju A i za koju vrijedi sljedeći uvjet:

gdje se γ=0÷1 bira iz subjektivnih razmatranja. Kada je γ = 1, Hurwitzov kriterij se transformira u Waldov kriterij.

Primjer 4.6. Pravi se studio za popravku televizora bolničkim uslovima. Radi jednostavnosti, pretpostavljamo da je tok zahtjeva za popravke izražen brojevima 2, 4, 6 i 8 hiljada prijava godišnje. Iz iskustva se zna da je dobit od popravke jednog televizora 9 den. jedinice u godini. Gubici uzrokovani nepopravkom zbog nedostatka kapaciteta - 5 den. jedinice Gubici zbog zastoja stručnjaka i opreme u nedostatku aplikacija - 6 dana. jedinice za svaku aplikaciju.



Navedite podatke o kapacitetu studija koji se kreira prema datim kriterijumima.

Rješenje. Igrač A ovdje je tijelo koje donosi odluke o kapacitetu kreiranog studija. Njegove čiste strategije su:

■ A 1 - otvaranje studija kapaciteta 2 hiljade televizora godišnje;

§ A 2 - otvaranje studija kapaciteta 4 hiljade televizora godišnje;

■ A 3 - otvaranje studija kapaciteta 6 hiljada televizora godišnje;

■ A 4 - otvaranje studija kapaciteta 8 hiljada televizora godišnje.

Drugi igrač je ukupnost svih okolnosti u kojima se formira tok zahtjeva za popravku TV-a u studiju, tj. priroda P. Priroda može ostvariti bilo koje od četiri stanja:

P 1- protok će biti 2 hiljade televizora godišnje;

■ P g - protok će biti 4 hiljade televizora godišnje;

P 3- protok će biti 6 hiljada televizora godišnje;

§ P 4- protok će biti 8 hiljada televizora godišnje.

Izračunajmo isplate a ik igrača A pod bilo kojom kombinacijom okolnosti ( A i , P k). Najpovoljnije situacije će biti kada se broj pristiglih prijava poklopi sa mogućnostima studija.

Za kombinaciju ( A 1, P 1) dobit će biti 11 = 2 * 9 = 18 hiljada. jedinice, za kombinaciju ( A 2, P 2) imamo 22 = 4 * 9 = 36 hiljada den. jedinice itd.

Za slučaj ( A 1, P 2) u studiju možete popraviti 2 hiljade televizora, a primljeno je 4 hiljade prijava. Gubici u ovom slučaju će biti 2 * 5 = 10 hiljada. jedinica, a ukupna dobit a n =2*9-2*5=8 hiljada den. jedinice

Za slučaj ( A i , P k) u studiju je moguće popraviti 4 hiljade televizora, a pristiglo je 2 hiljade prijava.Gubici u ovom slučaju će biti 2 * 6 = 12 hiljada. jedinica, a ukupna dobit a 21 = 18-12 = 6 hiljada den. jedinice Slično se nalaze i drugi elementi matrice plaćanja. Rezultati proračuna prikazani su u tabeli. 4.13.

Sa stola 4.13 proizlazi da je niža neto cijena igre

i gornju neto cijenu igre

Pošto je α ≠ β, igra ne sadrži sedlo. Statističar nema dominantne strategije.____________

Bayesov kriterijum. Neka su poznate vjerovatnoće q k prirodnog stanja P k. U tabeli. 4.13 ove vjerovatnoće su označene kao . Koristeći formulu (4.23) nalazimo vrijednosti prosječnih dobitaka. Ove vrijednosti su date u sedmoj koloni tabele. 4.13. Kao optimalna prema Bayesovom kriteriju, prihvaćena je čista strategija A 3 (otvoriti radionicu za 6 hiljada popravki godišnje) u kojoj je prosječan dobitak statistika .

Tabela 4.13

P 1(2) P 2(4) P 3(6) P 4(8) αi 0,8α i δi 0.2δi h i
A 1 (2) -2 -12 -12 3,5 -9,6 3,6 -6
A 2 (4) 23,5 4,8 7,2
A 3 (6) -6 -6 29,5 -4,8 10,8
A 4 (8) -18 -18 25,5 -14,4 14,4
β i
0,2 0,35 0,25 0,2
0,25 0,25 0,25 0,25

Ovdje se koriste sljedeće oznake:

Laplaceov kriterijum. Prema ovom kriteriju vjerovatnoće se pretpostavljaju jednakim i izračunavaju se pomoću formule

Čista strategija A 3 je takođe prihvaćena kao optimalna prema Laplaceovom kriterijumu, za koji je prosečna statistika isplate

Kriterijum divljaka. Da bismo analizirali igru ​​ovom metodom, napravićemo matricu rizika. Za proračune se koriste formule (4.21), (4.22). Rezultati proračuna prikazani su u tabeli. 4.14.

Kao što slijedi iz tabele. 4.14, minimum svih maksimalnih rizika je jednak . Ovaj rizik odgovara čistoj strategiji A 3 (otvoriti radionicu za 6 hiljada popravki godišnje).

Tabela 4.14

P 1 P 2 P 3 P 4 max rik
A 1
A 2
A 3
A 4

Waldov kriterij. Sa stola 4.13 jasno je da je niža neto cijena igre . Ova cijena odgovara čistoj strategiji Ag (otvoriti studio za 4 hiljade popravki godišnje).

Hurwitzov kriterijum. Postavimo γ = 0,8. Računamo pomoću formule δi= max a ik (vidi kolonu 10 u tabeli 4.13). Zatim, koristeći podatke iz kolona 6 i 10 tabele. 4.13, vršimo proračun pomoću formule.

Rezultat je prikazan u koloni 12 tabele. 4.13. Značenje i uklapanje u strategiju A 2(otvoriti studio za 4 hiljade popravki godišnje).

Laplaceov kriterijum

U brojnim slučajevima, sljedeće rezonovanje izgleda uvjerljivo: budući da su buduća prirodna stanja nepoznata, mogu se smatrati jednako vjerovatnim. Ovaj pristup rješenju se koristi u Laplaceovom kriteriju „nedovoljnog razloga“.

Da bi se riješio problem, za svako rješenje se izračunava matematičko očekivanje dobitka (pretpostavlja se da su vjerovatnoće prirodnih stanja jednake qj = 1/n, j = 1:n), a odabire se rješenje pri kojem se vrijednost ovog dobitka je maksimalna.

Hipoteza o jednakoj vjerojatnosti prirodnih stanja je prilično umjetna, pa se Laplaceov princip može koristiti samo u ograničenim slučajevima. U više opšti slučaj treba pretpostaviti da prirodna stanja nisu jednako vjerovatna i koristiti Bayes-Laplaceov kriterij za rješavanje.

Bayes-Laplaceov kriterij

Ovaj kriterij odstupa od uvjeta potpune neizvjesnosti - pretpostavlja da se mogućim prirodnim stanjima može dodijeliti određena vjerovatnoća njihovog nastanka i, nakon što se odredi matematičko očekivanje dobitka za svaku odluku, bira se ono koje daje najveću vrijednost dobitka:

Ova metoda pretpostavlja mogućnost korištenja bilo koje preliminarne informacije o prirodnim stanjima. To pretpostavlja i ponovljivost prirodnih stanja i ponovljivost odluka, a prije svega dostupnost dovoljno pouzdanih podataka o prošlim prirodnim stanjima. Odnosno, na osnovu prethodnih zapažanja, predvidjeti buduće stanje prirode (statistički princip).

Vraćajući se na našu tabelu 1, pretpostavimo da je q1=0,4, q2=0,2 i q3=0,4. Zatim, prema Bayes-Laplaceovom kriteriju, dopunimo tabelu 1 kolonom matematičkih očekivanja i između ovih vrijednosti izaberemo maksimum. Dobijamo tabelu 13.

Tabela 13.

Optimalno rješenje je X1.

Bayes-Laplaceov kriterij postavlja sljedeće zahtjeve na situaciju u kojoj se donosi odluka:

  • v vjerovatnoće pojave stanja Bj su poznate i ne zavise od vremena;
  • v rješenje se implementira (teoretski) beskonačno mnogo puta;
  • v za mali broj implementacija rješenja, određeni rizik je prihvatljiv.

Uz dovoljno veliki broj implementacija, prosječna vrijednost se postepeno stabilizira. Dakle, uz potpunu (beskonačnu) implementaciju, svaki rizik je eliminisan.

Početna pozicija korisnika - kriterij je optimističniji nego u slučaju Waldovog kriterija, međutim, pretpostavlja više visoki nivo svijest i dovoljno duge implementacije.

Navedeni kriterijumi ne iscrpljuju raznovrsnost kriterijuma za izbor rešenja u uslovima neizvesnosti, posebno kriterijume za izbor najboljih mešovitih strategija, međutim, to je dovoljno da problem izbora rešenja postane dvosmislen:

Tabela 14. Optimalne opcije dobivene korištenjem različitih kriterija

Iz tabele 14 je jasno da izbor optimalnog rješenja zavisi od odabranog kriterija (i, u konačnici, od pretpostavki).

Izbor kriterijuma (kao i izbor principa optimalnosti) je najteži i najvažniji zadatak u teoriji odlučivanja. Međutim, konkretna situacija nikada nije toliko neizvjesna da je nemoguće dobiti barem djelomične informacije o distribuciji vjerovatnoća prirodnih stanja. U ovom slučaju, nakon procjene distribucije vjerovatnoća prirodnih stanja, koristi se Bayes-Laplaceova metoda ili se provodi eksperiment kako bi se razjasnilo ponašanje prirode.

Budući da su različiti kriterijumi povezani sa različitim uslovima u kojima se odluka donosi, najbolji način da se uporede preporuke određenih kriterijuma je dobijanje dodatnih informacija o samoj situaciji. Konkretno, ako se odluka koja se donosi odnosi na stotine strojeva sa istim parametrima, onda se preporučuje korištenje Bayes-Laplaceovog kriterija. Ako broj mašina nije velik, bolje je koristiti kriterije minimax ili Savage.

Primjeri formulacija za rješavanje problema

U ovom dijelu, na primjeru rješavanja problema, moramo naučiti odrediti vektor strategija, vektor stanja i matricu plaćanja i primijeniti različite kriterije za dobivanje optimalnog rješenja.

Zadatak. Odlučeno je da se u primorskom gradu otvori jaht klub. Koliko jahti treba kupiti (na osnovu: jedna jahta za 5 osoba), ako se procijenjeni broj članova kluba kreće od 10 do 25 osoba. Godišnja pretplata košta 100 valutnih jedinica. Cijena jahte je 170 novčanih jedinica. Iznajmljivanje prostora i skladištenje jahti košta 730 novčanih jedinica godišnje.

Rješenje. Bez sumnje, ima smisla razmotriti broj jahti za kupovinu u rasponu od dvije do pet (4 opcije) i broj potencijalnih nautičara od 10 do 25. Da bismo smanjili obim nabrajanja, ograničit ćemo se na opcije 10 , 15, 20, 25 (ako se dobijeni zaključci za srodne opcije značajno razlikuju, izvršit ćemo dodatni, pojašnjavajući proračun). Dakle: X= (Xi) = (2, 3, 4, 5) - broj jahti (i=1,2,3,4); B = (Bj) =(10, 15, 20, 25) - broj članova jaht kluba (j=1,2,3,4).

Da bismo krenuli u potragu za rješenjem, konstruisaćemo matricu odluka čiji elementi pokazuju dobit pri donošenju i-te odluke sa j-tim brojem članova jaht kluba:

aij = 100 min (5Xi ; Bj) - 170Xi - 730

one. odlučujuće pravilo u našem problemu to je formulisano kao „prihodi – troškovi“.

Nakon obavljanja jednostavnih proračuna, popunimo matricu odluke (aij) (vidi tabelu 15):

matrično rješenje teorijske igre

Tabela 15. Matrica plaćanja

Na primjer, a11 = 100 min(52, 10) - 1702-730 =-70

a12=100min(52, 15)-1702-730=-70

a13 = a14 = -70 (potražnja za jahtama će ostati nezadovoljena). Negativne vrijednosti pokazuju da s ovim omjerima potražnje za jahtama i njihove dostupnosti, jahtaški klub ima gubitke.

Waldov kriterij (izbor oprezne, pesimistične strategije) - za svaku alternativu (broj jahti u klubu) bira se najgora situacija ( najmanju vrijednost iznos dobiti) i među njima se nalazi garantovani maksimalni efekat:

ZMM=max(-70; -240; -410; -580)=-70

Zaključak: pri donošenju odluke koristeći Wald kriterij, jahtaški klub treba kupiti 2 jahte i maksimalni očekivani gubitak neće prelaziti 70 CU.

Hurwitzov kriterij (kompromisno rješenje između najgoreg ishoda i previše optimističnog). Razmotrimo promjenu rješenja našeg problema ovisno o vrijednostima koeficijenta optimizma (u tabeli 16 vrijednosti koje zadovoljavaju Hurwitzov kriterij istaknute su za različite):

Tabela 16. Hurwitz rješenja za razne

Zaključak: na 0,5 trebali biste kupiti 5 jahti i očekivati ​​profit od oko 170 rubalja. (nadamo se širokoj popularnosti našeg kluba i određenoj finansijskoj isplativosti amatera), pri = 0,2 ne bismo trebali kupovati više od 2 jahte (oprezniji smo u našim prognozama i najvjerovatnije ćemo radije odbiti kreiranje klub).

Kriterijum divljaka (pronalaženje minimalnog rizika). Prilikom odabira rješenja na osnovu ovog kriterija, matrica korisnosti se prvo upoređuje sa matricom žaljenja D - na primjer, oduzimanjem (-70) od prvog stupca matrice korisnosti, 260 iz druge kolone, 590 i 920 iz treće i četvrte kolone, redom, dobijamo matricu rizika (vidi tabelu 17):

Tabela 17. Matrica rizika

Najmanja vrijednost među maksimalnim elementima reda (označene vrijednosti u tabeli) jednaka je:

ZS=min(990; 660; 340; 510)=340

Zaključak: kupovinom 4 jahte za jaht klub koji otvaramo, uvjereni smo da u najgorem slučaju gubici kluba neće premašiti 340 CU.

Bayes-Laplaceov kriterijum odlučivanja. Pretpostavimo da postoje statistički podaci koji nam omogućavaju da procijenimo vjerovatnoću određene potražnje za članstvom u jaht klubu: q=(0,1; 0,2; 0,4; 0,3). Zatim matematičko očekivanje vrijednosti dobiti za svaku od razmatranih opcija rješenja (nabavka jahti u jaht klubu):

a1r = (-700.1)+(-700.2)+(-700.4)+(-700.3) =-70 ,

a2r= (-2400,1)+(2600,2)+(2600,4)+(2600,3) =210;

a3r = 390; a4r = 370.

Zaključak: u uvjetima situacije koja se razmatra, najpoželjnije je kupiti 4 jahte (u ovom slučaju, maksimalni očekivani profit jaht kluba će biti 390 novčanih jedinica).

Za primjenu Laplaceovog kriterija nalazimo:

a1r = ((-70)+(-70)+(-70)+(-70)) / 4 = -70 ;

a2r = ((-240)+(260)+(260)+(260)) / 4 =135;

a3r = 215; a4r = 170.

Zaključak: pod uslovima jednake vjerovatnoće pojave jednog ili drugog zahtjeva za članstvom u jaht klubu, potrebno je kupiti 4 jahte i istovremeno računati na dobit od 215 VJ.

Opšti zaključak. Razmatrani kriterijumi dovode do različitih odluka i time daju povoda za razmišljanje ( odluka ovdje će značajno ovisiti o psihologiji i intuiciji subjekta odluke). To nije iznenađujuće, jer se kriteriji zasnivaju na različitim hipotezama. Uvođenjem jedne ili druge hipoteze o ponašanju okoline mi na taj način „otklanjamo nesigurnost“, ali sama hipoteza je samo pretpostavka, a ne znanje. Bilo bi čudno kada bi različite pretpostavke uvijek dovele do istog rezultata.

Donošenje odluka pod rizikom

Kao što je već pomenuto, donošenje odluka u rizičnim uslovima karakteriše činjenica da je ponašanje prirode (okruženja) nasumično. To se očituje u činjenici da postoji određena mjera vjerovatnoće u skladu s kojom nastaju (nastaju) određena prirodna stanja. Istovremeno, lice Dato rješenje ima određene informacije o vjerovatnoćama pojave stanja okoline, koja mogu biti vrlo raznolika po prirodi. Na primjer, postoje tri stanja okoline B1, B2 i B3, tada dodatne informacije o pojavi ovih stanja mogu biti da je stanje B1 najmanje vjerovatno, a stanje B3 vjerovatnije.

Shodno tome, donošenje odluka u uslovima rizika pretpostavlja, pored preciziranja funkcije implementacije, navođenje nekih Dodatne informacije o vjerovatnoći stanja životne sredine. Ako je skup prirodnih stanja B konačan (broj stanja jednak m), tada se mjera vjerovatnoće na njemu može specificirati vektorom vjerovatnoće q=(q1, q2, …, qm), gdje je qj?0 i.

Dakle, matrica isplate u uslovima rizika može se predstaviti na sledeći način (vidi tabelu 1)

Environment states

Prilikom odabira rješenja Xi, igrač zna da će dobiti jednu od isplata a11, ..., a1m sa vjerovatnoćama q1, ..., qm, respektivno. Prema tome, ishod za donosioca odluke pri izboru rješenja Xi je slučajna varijabla

Dakle, poređenje dva rješenja X1 i X2 svodi se na poređenje njihovih odgovarajućih slučajnih varijabli.

Odabir optimalnog rješenja obično se temelji na jednom od sljedećih kriterija:

  • 1) Bayes-Laplaceov kriterijum - očekivana vrijednost (profit ili rashod);
  • 2) kombinacije očekivane vrednosti i varijanse;
  • 3) kriterijum proizvoda;
  • 4) najvjerovatniji događaj u budućnosti i drugi.

Pogledajmo pobliže Bayes-Laplaceov kriterijum.

Test očekivane vrijednosti (Bayes-Laplaceov test)

U prošlom predavanju smo se osvrnuli na Bayes-Laplaceov kriterijum. Upotreba ovog kriterija (drugi naziv se nalazi u literaturi - kriterij “očekivana prosječna vrijednost”) je zbog želje da se maksimizira očekivani profit (ili minimizira očekivani troškovi). Upotreba očekivanih vrijednosti podrazumijeva mogućnost ponovnog rješavanja istog problema dok se ne dobiju dovoljno točne vrijednosti. formule za izračunavanje. Matematički, to izgleda ovako: neka o bude slučajna varijabla sa matematičkim očekivanjem Mo i varijansom Do. Ako su x1, x2,..., xn vrijednosti slučajna varijabla(s.v.) oh, onda aritmetička sredina njihovih vrijednosti (srednja uzorka).

ima varijansu. Dakle, kada je n>

Drugim riječima, uz dovoljno veliku veličinu uzorka, razlika između aritmetičke sredine i matematičkog očekivanja teži nuli (tzv. granična teorema teorije vjerovatnoće). Shodno tome, upotreba kriterija “očekivana vrijednost” vrijedi samo u slučaju kada se isto rješenje mora primijeniti dovoljno veliki broj puta. Vrijedi i suprotno: fokusiranje na očekivanja će dovesti do pogrešnih rezultata za odluke koje se moraju donijeti mali broj puta.

Prije nego što pređemo na modificiranje Bayes-Laplaceovog kriterija, razmotrimo ovaj kriterij detaljnije.

Poznato je da je prirodna numerička karakteristika slučajne varijable o njeno matematičko očekivanje Mo, kojem se srednja vrijednost ove slučajne varijable približava u velikom broju testova.

Ako osoba koja se suprotstavlja prirodi ima statističke podatke o obrascima u određenim manifestacijama prirode, onda se problem može lako riješiti korištenjem probabilističkih metoda.

Dakle, ako su vjerovatnoće stanja prirode poznate i ne mijenjaju se tokom vremena (stacionarne), tada bi rješenje koje maksimizira očekivani dobitak (koje daje najveće matematičko očekivanje dobiti u odnosu na poznatu strategiju prirode - stanje ili stanje) trebalo smatrati optimalnim.

Primjer. Kompanija je kupila mašinu za 100 novčanih jedinica. Da biste ga popravili, možete kupiti specijalnu opremu za 50 jedinica. ili se zadovoljiti starom opremom. Ako mašina pokvari, njen popravak uz pomoć posebne opreme košta 10 jedinica, bez posebne opreme - 40 jedinica. Poznato je da tokom svog radnog veka mašina ne otkaže više od tri puta: verovatnoća da se mašina neće pokvariti je 0,3; pauze 1 put - 0,4; pauze 2 puta - 0,2; pauze 3 puta - 0,1. Potrebno je utvrditi izvodljivost kupovine specijalizovane opreme za popravku.

Formalizacija. Prvi igrač ima dvije čiste strategije: kupiti (X1) i ne kupiti (X2) specijalizovanu opremu za popravku. Priroda, drugi igrač, ima četiri stanja: mašina neće otkazati, jednom će otkazati, dvaput će se pokvariti i tri puta će se pokvariti. Funkcija isplate su troškovi kompanije za kupovinu i popravku mašine, specificirani matricom plaćanja (vidi tabelu 1):

Tabela 1.

Kvar mašine

B1, nikad

X1, ne kupuj

X2, kupi

Rješenje. Hajde da prvo razmotrimo ovaj problem kao antagonističku igru. Koristeći metodu minimaks, nalazimo sedlo u matrici: (X2, B4), tako da je cena igre v= - 180 novčanih jedinica (vidi tabelu 2).

Tabela 2.

Kvar mašine

B1, nikad

X1, ne kupuj

X2, kupi

Odgovor: morate kupiti specijalizovanu opremu.

Međutim, u igrama s prirodom situacija se radikalno mijenja: uvjet već sadrži stabilnu mješovitu strategiju prirode: q = (0,3; 0,4; 0,2; 0,1) i znamo da se priroda pridržava upravo te strategije.

Ako osoba - prvi igrač - nastavi da igra optimalno, onda će njegova isplata biti M=-150H0.3-160Č0.4-170Č0.2-180Č0.1=-161, a ako koristi prvu, neoptimalna strategije, onda će njegovo matematičko očekivanje dobitak biti M=-100H0.3 - 140H0.4 - 180H0.2 -220H0.1 =-144.

Dakle, isplativo je da prvi igrač igra neoptimalno!

Tabela 3.

Kvar mašine

B1, nikad

X1, ne kupuj

X2, kupi

Odgovor: ne kupujte specijalizovanu opremu.

Značajna razlika između vrijednosti v(x*) i v(x") objašnjava se činjenicom da mješovita strategija prirode nije optimalna i "odstupanjem" od svoje optimalne strategije "gubi" 36 novčane jedinice dobitka.

Dakle, u igri s prirodom, orijentacija prema matematičkom očekivanju pobjede je zapravo orijentacija na prosječan dobitak, koji će se dobiti kada se ova igra više puta ponovi (pod pretpostavkom da se uvjeti igre ne mijenjaju). Naravno, ako se igra zaista ponovi mnogo puta, onda se kriterij prosječne dobiti (na primjer, u ekonomskim problemima - prosječna dobit) može smatrati opravdanim. Međutim, da li je razumno fokusirati se na ovaj kriterij u jednom testu?

Razmotrite sljedeći primjer. Firma I može staviti na prodaju jednu od roba TI1 ili TI2, a firma II može ponuditi jednu od roba TII1, TII2, TII3. Roba TI1 i TII1 su konkurentna (na primjer, pivo i limunada), a roba TI1 i TII3 su komplementarna (na primjer, pivo i plotica); ostali proizvodi su neutralni. Dobit firme I zavisi od kombinacije dobara koje obe firme nude na prodaju, a određena je tabelom 4. Poznato je da firma II stavlja na prodaju proizvod TII3 tri puta ređe od TII1 i četiri puta ređe od TII2. . Koji proizvod treba prodati firmi I?

Tabela 4

Environment states

Evo odluke da firma I stavi na prodaju proizvod TI1, odluka X2 da firma I stavi na prodaju proizvod TI2.

Izračunajmo matematička očekivanja za ovu tabelu:

M=8H3/8+18H4/8+40H1/8=17, M=18H3/8+15H4/8+14H1/8=16.

Optimalna strategija će biti rješenje X1, tj. Firma I isporučuje robu za TI1. Naravno, isplata od 17 novčanih jedinica je bolja od 16. Međutim, pri odabiru rješenja X1, nećemo dobiti 17 novčanih jedinica, već jedan od dobitaka: 8, 18 ili 40. Prilikom odabira rješenja X2, nećemo dobiti 16 novčanih jedinica, ali jedan od dobitaka je 18, 15 ili 14. Napravimo tabelu koja prikazuje odstupanja mogućih dobitaka od njihovih očekivanih vrijednosti i vjerovatnoću tih odstupanja.

Tabela 5. Vrijednosti odstupanja

Iz ove tabele se vidi da kod jednakih očekivanih dobitaka odstupanja od očekivanih dobitaka vode različito: za X1 ova odstupanja su značajna, a za X2 relativno mala.

Iz analize možemo zaključiti: u uslovima rizika Bayes-Laplaceov kriterijum (očekivani prosječni dobitak) nije adekvatan i treba ga mijenjati uzimajući u obzir moguća odstupanja slučajna varijabla od njene prosječne vrijednosti.

U teoriji vjerovatnoće, varijansa Do ili standardna devijacija y= obično se koristi kao mjera odstupanja slučajne varijable od njene srednje vrijednosti. U problemima donošenja odluka u uslovima rizika, smatraćemo standardnu ​​devijaciju y kao indikator rizika, jer y ima istu dimenziju kao slučajna varijabla o, matematičko očekivanje Mo.

Dakle, za donošenje odluke u uslovima rizika, izbor alternative Xi dovodi do slučajne varijable oi, koja se može okarakterisati parom indikatora (Mo, ui). Sada krenimo sa konstruisanjem adekvatnog kriterijuma za poređenje alternativa. U stvari, ovdje dobijamo problem optimizacije s dva kriterija, gdje su parcijalni kriteriji matematičko očekivanje Mo (vrijednost ovog kriterija treba maksimizirati) i standardna devijacija y (vrijednost ovog kriterija treba minimizirati).

Razmotrimo pronalaženje Pareto-optimalnih rješenja za ovaj višekriterijumski problem. Pretpostavimo da je potrebno izabrati jedno optimalno rješenje iz skupa izvodljivih rješenja, od kojih je svako određeno parom indikatora (Moi, ui). Prikazom tačaka sa koordinatama (Moi, ui) na koordinatnoj ravni dobijamo sliku tipa prikazanog na Sl. 1, tj. dobili smo prostor za procjene. Lijeva strana značenja slike (crvene tačke). matematičko očekivanje uzeli smo pozitivne i y negativne vrijednosti, jer Moramo minimizirati ovaj kriterij (y). Pareto optimalne procjene su ispravne gornja granica i, shodno tome, Pareto optimalna rješenja X1, X2, X9 i X7.

U ovom primjeru skup Pareto-optimalnih rješenja je X1, X2, X9, X7 i iz tog skupa se vrši konačni izbor optimalnog rješenja. Kao što je gore pomenuto, ovde postoje dva pristupa: prvi pristup je da se konstruiše skup Pareto-optimalnih rešenja i iz tog skupa donosilac odluke bira jedinstveno rešenje zasnovano na neformalnim dodatnim razmatranjima. Razmotrimo drugi pristup zasnovan na sužavanju skupa Pareto-optimalnih alternativa.

  • 1. Izbor glavnog kriterijuma i dodela donjih granica za ostale kriterijume. Dodijelimo donju granicu prema kriteriju M i minimiziramo kriterij y. Kao donju granicu kriterija M uzimamo vrijednost M4 (vidi sliku 1), tada će optimalno rješenje biti X2, pa će među rješenjima koja zadovoljavaju uslov Mi? M4, to je najmanje rizično.
  • 2. Leksikografska optimizacija uključuje sortiranje kriterijuma po važnosti. Neka je, na primjer, M najvažniji kriterij. Budući da jedino rješenje X7 ima maksimalnu vrijednost prema kriteriju M, ono je optimalno. Ovo jasno pokazuje nedostatak metode leksikografske optimizacije: uzimanje u obzir jednog (najvažnijeg) kriterijuma. Ovaj nedostatak je povezan sa potrebom da se uvede strogi prioritet kriterijuma i može se otkloniti slabljenjem „rigidnosti“ prioriteta. U ovom slučaju se koristi metoda sukcesivnih ustupaka (metoda promjene cilja), o kojoj je gore bilo riječi.

Na primjer, u našem slučaju, kao ustupak prema kriteriju M, vrijednost D prikazana na sl. 1. Tada će rezultat izbora u prvom koraku biti alternative X7, X8, X9. Među njima će po drugom kriteriju biti najbolji X9. Dakle, blagim snižavanjem zahtjeva za kriterij M, značajno smo poboljšali procjenu za kriterij y (tj. blagi pad očekivanog dobitka doveo je do značajnog smanjenja rizika).


Rice. 1.

Razmotrimo primjenu generaliziranog kriterija za naš problem. Uzmimo kao generalizirani kriterij funkciju oblika:

f(M, y)= M-lChu, (1)

gdje je l neka konstantna vrijednost. Zapravo, kriterij (1) predstavlja aditivni kriterij optimalnosti za parcijalne kriterije M, y sa težinskim koeficijentima 1 i - l. Kada je n>0, procjena slučajne varijable korištenjem aditivnog kriterija (1) je manja od njene prosječne vrijednosti, što je tipično za oprezna osoba, tj. osoba sklona riziku. Naprotiv, kada l<0 оценка (1) выше, чем среднее значение, что характеризует человека, склонного к риску. Наконец, при л=0 оценка случайной величины совпадает с её средним значением (т.е. возможные отклонения случайной величины от её среднего значения игнорируются) - это характеризует человека, безразличного к риску.

Suštinsko značenje aditivnog kriterija (1) za n>0 je da do povećanja kriterija f(M, y) može doći i zbog povećanja M i zbog smanjenja y. Dakle, za osobu koja nije sklona riziku, kriterijum (1) odražava želju da se poveća očekivani dobitak i smanji rizik od odstupanja od njega. U ovom slučaju, indikator l karakteriše subjektivni stav donosioca odluke prema riziku. Stoga se l može smatrati subjektivnim pokazateljem mjere averzije prema riziku (subjektivni indikator opreza).

Odabir varijante proizvoda za proizvodnju. Kompanija može proizvoditi proizvode od sljedećih šest vrsta: kišobrani (Z), jakne (K), kabanice (P), torbe (S), cipele (T) i (W). Rukovodilac kompanije mora odlučiti koje će od ovih vrsta proizvoda proizvoditi tokom predstojeće ljetne sezone. Dobit preduzeća zavisi od toga kakvo će ljeto biti - kišno, vruće ili umjereno, a određuje ga tabela 6. Koja opcija proizvodnje će biti optimalna?

U nedostatku dodatnih informacija o stanjima životne sredine u uslovima neizvesnosti, njeno rešenje je moguće prihvatanjem bilo koje hipoteze o ponašanju okoline. Ako donosilac odluke ima informacije o vjerovatnoći kišnog, toplog i umjerenog ljeta, tada navedeni problem postaje problem odlučivanja o riziku. U tom slučaju, potrebne informacije mogu se uzeti iz statističkih podataka (zapažanja vremena na datom području). Pretpostavimo da je vjerovatnoća kišnog, vrućeg i umjerenog ljeta 0,2, 0,5 i 0,3, respektivno. Tada dobijamo problem donošenja odluka u uslovima rizika, dato po tabeli 7.

Tabela 6.

Nađimo očekivane isplate koje odgovaraju rješenjima Z, K, P, S, T, W. Imamo:

MZ=0,2H80+0,5H60+0,3H40=58,

Mk=0,2H70+0,5H40+0,3H80=58,

MP=0,2H70+0,5H50+0,3H60=57,

MS=0,2H50+0,5H50+0,3H70=56,

MT=0,2H75+0,5H50+0,3H50=55,

DoZ=196, DoK=336, DoP=61, DoC=84, DoT=100, DoSh=231,5. Standardne devijacije slučajne varijable koje se razmatraju su:

yZ=14,0, yK=18,3, yP=7,8, yS=9,2, yT=10,0, ySh=15,2.

Napravimo tablicu vrijednosti kriterija M i y za svaku alternativu (tabela 8)

tabela 8

Kriterijumi

Predstavimo razmatrana rješenja kao tačke na koordinatnoj ravni varijabli M i y i dobićemo sl. 2, od kojih su Pareto-optimalna rješenja Z, P, Sh. Konačan izbor optimalne alternative mora se napraviti iz ovog skupa.

Sužavanje Pareto-optimalnog skupa (idealno na jedan element) može se izvršiti samo ako postoje dodatne informacije o odnosu između kriterija M i y. Kao što je već spomenuto, to se može učiniti metodom glavnog kriterija, metodom uzastopnih ustupaka ili korištenjem leksikografskog kriterija.

Pregled kriterijuma odlučivanja u uslovima rizika

Kriterijum rada

Pravilo odabira u ovom slučaju je formulirano na sljedeći način:

Matrica odluke je dopunjena novom kolonom koja sadrži proizvode svih rezultata svakog reda. Odabiru se one opcije čije linije sadrže najviše vrijednosti ovu kolonu.

Primjena ovog kriterija je zbog sljedećih okolnosti:

  • · vjerovatnoće pojave stanja Bj su nepoznate;
  • · mora se uzeti u obzir pojava svakog od stanja Bj posebno;
  • · kriterij je primjenjiv i za mali broj implementacija rješenja;
  • · određeni rizik je prihvatljiv.

Kriterij proizvoda prilagođen je prvenstveno za slučajeve u kojima su svi aij pozitivni. Ako je uslov pozitivnosti narušen, onda treba izvršiti neki pomak aij+a sa nekom konstantom a>. Rezultat će naravno zavisiti od a. U praksi najčešće

Ako se nijedna konstanta ne može prepoznati kao da ima značenje, onda kriterij proizvoda nije primjenjiv.

Prethodna Početna Sljedeća

Donošenje odluka u rizičnim uslovima uz mogućnost izvođenja eksperimenta

Prilikom donošenja odluke u uvjetima neizvjesnosti (ili u uslovima rizika), fundamentalna poteškoća u izboru rješenja nastaje zbog nepoznavanja pravog stanja okoliša od strane donosioca odluke. U prethodnim predavanjima razmatrano je nekoliko kriterijuma, od kojih se svaki na svoj način „bori” sa neizvesnošću: postavljanjem hipoteze o ponašanju okoline (kriterijum Laplacea, Walda, Hurwitza i Savagea); usrednjavanjem rezultujućih dobitaka (Bayes-Laplaceov kriterijum ili kriterijum očekivanog dobitka); uzimajući u obzir i očekivani dobitak i mjeru odstupanja od njega. Međutim, svaki od ovih pristupa pruža samo način za racionalnu analizu neizvjesnosti, bez eliminacije same nesigurnosti. Otklanjanje ili barem smanjenje neizvjesnosti može se izvršiti samo na osnovu razjašnjenja pravog stanja životne sredine.

U praksi se takvo pojašnjenje provodi, po pravilu, prikupljanjem dodatnih informacija, kao i provođenjem eksperimenata, čiji se rezultati koriste za procjenu trenutnog stanja okoliša. Na primjer, prije početka liječenja pacijenta s nejasnom dijagnozom, liječnik provodi dodatni testovi; Prije bušenja skupe naftne bušotine, geolog vrši seizmičko istraživanje; Prije početka proizvodnje bilo kojeg proizvoda, poduzetnik pravi probnu seriju ovog proizvoda itd. U okviru teorije odlučivanja, sve ove radnje ne znače ništa drugo do provođenje eksperimenta kako bi se razjasnilo stanje okoline.

Eksperiment se naziva idealnim ako na osnovu njegovih rezultata donosilac odluke prepozna pravo stanje okoline. U praksi, imati savršen eksperiment je prilično rijetko. Najčešće, rezultat eksperimenta daje neke informacije na osnovu kojih se može razjasniti okruženje.

Kako iskoristiti rezultate eksperimenta i dostupne statističke podatke za najefikasnije donošenje odluka? Jedna od metoda za rješavanje ovog problema temelji se na Bayesovoj formuli - formuli za ponovno procjenu vjerovatnoće događaja uzimajući u obzir rezultate eksperimenta.

Imajte na umu da eksperiment nije moguć za svaki problem donošenja odluka. Ako je eksperiment moguć za određeni zadatak, onda se javlja zadatak procjene izvodljivosti njegove provedbe. Činjenica je da provođenje eksperimenta uvijek zahtijeva troškove (materijalne, organizacione, vremenske, itd.).

[Rosen] pokazuje da je idealan eksperiment isplativ ako i samo ako je njegov trošak manji od minimalnog očekivanog rizika:

gdje su rij rizici, C je cijena eksperimenta.

Da bismo predstavili Bayesov pristup ponovnoj procjeni vjerovatnoća, prisjetimo se nekih koncepata iz teorije vjerovatnoće.

Uslovna vjerovatnoća događaja A s obzirom da se događaj B dogodio označava se sa P(A/B) i izračunava se po formuli

Razmotrimo sljedeću shemu teorijske vjerovatnoće. Neka je B1, B2, …, Bm potpuna grupa događaja i za svaki događaj Bj, j= poznata je njegova vjerovatnoća P(Bj). Neka se izvede eksperiment zbog kojeg se dogodio događaj A. Ako su poznate uslovne vjerovatnoće P(A/Bj) za sve j=, tada je uslovna vjerovatnoća (posteksperimentalna) vjerovatnoća događaja Bj (j=, ) može se naći pomoću Bayesove formule

Razmotrimo sada u šematskom obliku problem donošenja odluka u uslovima rizika, specificiranih korišćenjem matrice isplate, koja ima tabelu oblika.

Tabela 1. Matrica plaćanja sa vektorom vjerovatnoće stanja okoliša

Environment states

Ovdje su B1, B2, …, Bm stanja okruženja, aij je isplata igrača u situaciji kada on odabere strategiju Xi, a okruženje zauzima stanje Bj. Donosilac odluke zna vjerovatnoću P(Bj)= qj pojave stanja Bj, i P(Bj)?0 i. Pretpostavlja se da medij može biti u jednom i samo jednom od stanja B1, B2, ..., Bm. Drugim riječima, slučajni događaji B1, B2, ..., Bm čine kompletnu grupu događaja, pa se mogu uzeti kao hipoteze. Verovatnoće stanja okruženja poznatih donosiocu odluka P(Bj) (j=) su bezuslovne (pre-eksperimentalne, a priori) verovatnoće.

Pretpostavimo da se radi neki eksperiment čiji rezultat nekako zavisi od postojećeg stanja životne sredine. Ako se, kao rezultat eksperimenta, opazi događaj A i, osim toga, poznate su uvjetne vjerovatnoće P(A/Bj) za sve j=, tada se pomoću Bayesove formule može pronaći post-eksperimentalni (posteriorni) vjerovatnoće svakog stanja okoline. Poznavanje rafiniranih vjerovatnoća stanja životne sredine omogućava vam da preciznije odredite strategiju donosioca odluka.

Opisani pristup donošenju odluka pod rizikom naziva se Bayesovskim, jer se zasniva na Bayesovoj formuli. Ovaj pristup je ilustrovan primjerom koji se razmatra u nastavku.

Zadatak. Bušenje naftnog bunara.

Šef grupe za pretragu mora donijeti odluku: bušiti naftnu bušotinu ili ne. Bunar može biti „suh“ (C), tj. bez ulja, “male snage” (M), tj. sa niskim sadržajem ulja, i “bogatim” (B), tj. sa visokim sadržajem ulja. Alternative vođe grupe su: x1 - bušiti i x2 - ne bušiti. Neto dobit pri odabiru jedne od alternativa, ovisno o mogućem tipu bunara, prikazana je u tabeli dobiti (vidi tabelu 1)

Tabela 1. Matrica plaćanja

Pa tip

Pored toga, vođa grupe za pretragu zna da su u datom području vjerovatnoće suvog, tankog ili bogatog bunara sljedeće: P(C)=0,5, P(M)=0,3, P(B)=0,2.

Šef grupe za pretragu može provesti eksperiment kako bi razjasnio strukturu tla (stanje okoliša). Ovaj eksperiment je seizmičko istraživanje, čiji će rezultat biti odgovor - kakva je struktura tla na datom području (ali ne i odgovor na pitanje o vrsti bunara!). U principu, struktura tla može biti otvorena (O) ili zatvorena (C). Vođa grupe ima tabelu sa rezultatima eksperimenata datih u ovoj oblasti (vidi tabelu 2).

Tabela 2. Tablica eksperimentalnih podataka

Ova tabela pokazuje koliko su puta naišli bunari tipa C, M, B na tlima otvorene i zatvorene strukture tla (tj. daje zajedničku statistiku tla i tipa bunara za dato područje).

Analizirajmo eksperimentalne podatke rezultirajuće tablice. Pretpostavimo da je izvedeno n eksperimenata čiji su rezultati vrijednosti diskretnih slučajnih varijabli X (tip bunara) i Y (struktura tla), koje uzimaju vrijednosti C, M, B i O, Z, respektivno. Označimo sa n11 broj eksperimenata u kojima je X = C i Y=O, nakon n12 broj eksperimenata u kojima je X=C i Y=Z, nakon n21 broj eksperimenata u kojima je X=M i Y=O, itd. U našem slučaju n=100, n11=45, n12=5, n21=11. Podijeleći vrijednosti u tabeli 2 sa 100 (brojem izvedenih eksperimenata), dobijamo zakon distribucije dvodimenzionalne slučajne varijable (X, Y) dat u tabelarnom obliku (vidi tabelu 3).

Tabela 3. Statističke serije distribucija dvodimenzionalne r.v. (X, Y)

Iz tabele 3 proizilazi da je P(X=C)=P(C)=0,5, P(X=M)=P(M)=0,3, P(X=B)=P(B)=0,2; R(Y=O)=P(O)=0,6, R(Y=Z)=P(Z)=0,4,

Dakle, vođa grupe mora odlučiti:

  • · da li provesti eksperiment (njegova cijena je 10 jedinica);
  • · ako se sprovede, šta dalje raditi u zavisnosti od rezultata eksperimenta.

Tako je dobijen višestepeni problem odlučivanja u uslovima rizika. Opišimo metodu pronalaženja optimalnog rješenja.

Korak 1. Napravimo stablo (slika 1), koje ukazuje na sve faze procesa donošenja odluka – stablo odlučivanja. Grane stabla odgovaraju mogućim alternativama, a vrhovi odgovaraju situacijama u nastajanju. Alternative za vođu grupe za pretraživanje su: b - odbijanje eksperimenta, c - izvođenje eksperimenta, x1 - vježbanje, x2 - ne vježbanje. Prirodna stanja: izbor tipa bunara (C, M, B), kao i izbor strukture tla (O, W).

Konstruirano drvo određuje igru ​​vođe grupe s prirodom. Pozicije ove igre su vrhovi stabla, a potezi igrača su rješenja koja biraju. Položaji u kojima vođa grupe čini potez su prikazani pravougaonikom; zaokruženi su položaji u kojima se priroda kreće.

Igra se odvija na sljedeći način. U početnoj poziciji, vođa grupe pravi potez. On mora donijeti odluku - odbiti eksperiment (odabrati rješenje b) ili provesti eksperiment (odabrati rješenje c). Ako je odustao od eksperimenta, igra se pomiče na sljedeću poziciju u kojoj vođa grupe mora donijeti odluku: vježbati (odabrati alternativu x1) ili ne vježbati (odabrati alternativu x2). Ako odluči provesti eksperiment, igra se pomiče u poziciju u kojoj priroda čini potez, birajući jedno od stanja O ili Z, odgovarajući mogući rezultati eksperiment, itd. Igra se završava kada dostigne konačnu poziciju (tj. vrh drveta za koji nema grana koje izviru iz njega)

Korak 2. Za svaku odluku koja je potez prirode (tj. dolazi iz položaja prikazanog krugom), moramo pronaći vjerovatnoću ovog poteza. Da bismo to učinili, postupamo na sljedeći način. Za svaku poziciju stabla postoji jedna staza koja povezuje tu poziciju sa početnom pozicijom. Ako je ovo za položaj prirode, put koji ga povezuje sa početnim položajem ne prolazi kroz poziciju (E), što znači eksperiment, tada su vjerovatnoće stanja P(S), P(M) i P(B ) su bezuslovni (pre-eksperimentalni) i iz tabele. 3:

P(S)=50/100, P(M)=30/100, P(B)=20/100.

Ako za položaj prirode put koji ga povezuje sa početnim položajem prolazi kroz poziciju (E), tada vjerovatnoće stanja okoline postaju uslovne vjerovatnoće i nalaze se prema formulama (1), koristeći podatke u tabeli. . 3:

U poziciji (E), vjerovatnoće poteza koji vode do pozicija (O) i (W) nalaze se iz Tabele 3: P(O)=0,6, P(Z)=0,4.


Rice. 1.

Korak 3. Procijenimo sve pozicije stabla igre, "spuštajući se" od konačnih pozicija do početne. Ocjena pozicije je očekivani dobitak na ovoj poziciji. Procjene za konačne pozicije nalazimo iz Tabele 2. Sada ukazujemo na metodu za pronalaženje procjene za proizvoljnu poziciju stabla igre pod pretpostavkom da su procjene za sve pozicije koje slijede već pronađene.

Za položaj prirode, njena procjena predstavlja očekivani dobitak (vidi sliku 2);

Za poziciju igrača, procjena je maksimum svih pozicija iza njega. Motiv: u „svojoj“ poziciji igrač može napraviti bilo koji potez, pa će izabrati onaj koji vodi do najveće moguće pobjede (vidi sliku 3). U svakoj poziciji igrač crticu označava granu drveta koja vodi do pozicije sa maksimalnim rezultatom.


Okrenimo se Sl. 1. Nalazimo da je na početnoj poziciji očekivani profit bez izvođenja eksperimenta (alternativa b) 20 jedinica; očekivani profit sa eksperimentom (alternativa c) je 28 jedinica. Stoga je odgovarajuće rješenje izvođenje eksperimenta (seizmičko istraživanje). Dalje, ako eksperiment pokaže da je tlo otvoreno, onda ne treba raditi bušenje, ali ako je zatvoreno, onda treba izvršiti bušenje.

  • 1 - grana: =20
  • 2 - grana: 0
  • 3 - grana:= -30
  • 4 - grana: 0
  • 5 - grana: =95
  • 6 - grana: 0

Kao što slijedi iz uslova zadatka, možemo dobiti vrijednost od 95 jedinica sa vjerovatnoćom 0,4. Dakle, očekivani dobici će biti 0,4*95=38 jedinica. Oduzimamo cijenu eksperimenta jednaku 10 jedinica.

Kao rezultat, dobijamo 28 jedinica.

Stabla odlučivanja hijerarhijski predstavljaju logičku strukturu donošenja odluka i na taj način olakšavaju razumijevanje problema i procesa njegovog rješavanja. Za razliku od matrice odluka, ovdje možete vidjeti vremenski tok procesa donošenja odluka. Stablo odlučivanja, međutim, općenito ne može biti predstavljeno jednostavnom matricom odlučivanja; Na ovaj način mogu se predstaviti samo pojedinačne faze procesa. Podjela na etape vrši se tako da izbor rješenja počinje određenim čvorom odlučivanja iz kojeg izlazi jedna ili više grana koje predstavljaju opcije rješenja. Nakon toga slijede čvorovi događaja i na kraju - listovi" koji predstavljaju konačna stanja koja ukazuju na vrijednosti odgovarajućih izlaznih parametara. Ako nakon čvorova događaja opet slijedi čvor odluke s odgovarajućim akcijama, tada ova i sve naredne grane odnose se na više kasna faza odabir rješenja.. Tako možete pratiti cijeli put od početka do kraja stabla odlučivanja.

Stablo odlučivanja pravi razliku između čvorova događaja i čvorova odluke. Može se zamisliti da je u čvorovima događaja određen izbor daljeg puta spoljni uslovi(po prirodi, u teoriji igara od strane protivnika), a u čvorovima odlučivanja od strane donosioca odluke.

Stabla odlučivanja je lako modificirati: ako je potrebno, mogu se dalje razvijati, au slučajevima kada su neke grane praktički besmislene, mogu se shodno tome i smanjiti. Čvorovi odluke, ako su povezani s jednom radnjom i nisu odvojeni čvorovima događaja, mogu se kombinirati. Isto vrijedi i za čvorove događaja.



Novo na sajtu

>

Najpopularniji