Mājas Higiēna Ekspertu vērtējumi par minimaksa metodi un Bayes-Laplace un Savage metodēm. Skatiet lapas, kurās ir minēts termins Bayes kritērijs

Ekspertu vērtējumi par minimaksa metodi un Bayes-Laplace un Savage metodēm. Skatiet lapas, kurās ir minēts termins Bayes kritērijs

Vingrinājums. Uzņēmums plāno realizēt produkciju tirgos, ņemot vērā iespējamos variantus patērētāju pieprasījumam P j , j = 1,4 (zems, vidējs, augsts, ļoti augsts). Uzņēmums ir izstrādājis trīs stratēģijas preču pārdošanai A 1, A 2, A 3. Apgrozījuma apjoms (naudas vienības), atkarībā no stratēģijas un patērētāju pieprasījuma, ir parādīts tabulā.
P 1P 2P 3P 4
A 130+N10 20 25 + N/2
A 250 70 - N10 + N/225
A 325 – N/235 40 60 - N/2
kur N = 3
Ir zināmi iespējamie patērētāju pieprasījuma stāvokļi, kas ir attiecīgi q 1 =0,3, q 2 =0,2, q 3 =0,4, q 4 =0,1. Ir jāatrod pārdošanas stratēģija, kas maksimāli palielina uzņēmuma vidējo apgrozījumu. Šajā gadījumā izmantojiet Wald, Hurwitz, Savage un Bayes kritērijus.

Risinājums atrodiet, izmantojot kalkulatoru.
Beijesa kritērijs.
Saskaņā ar Beijesa kritēriju par optimālu tiek pieņemta stratēģija (tīrā) A i, kas palielina vidējo pieaugumu a vai samazina vidējo risku r.
Mēs saskaitām vērtības ∑(a ij p j)
∑(a 1,j p j) = 33 0,3 + 10 0,2 + 20 0,4 + 26,5 0,1 = 22,55
∑(a 2,j p j) = 50 0,3 + 67 0,2 + 11,5 0,4 + 25 0,1 = 35,5
∑(a 3,j p j) = 23,5 0,3 + 35 0,2 + 40 0,4 + 58,5 0,1 = 35,9

A iP 1P 2P 3P 4∑(a ij p j)
A 1 9.9 2 8 2.65 22.55
A 2 15 13.4 4.6 2.5 35.5
A 3 7.05 7 16 5.85 35.9
p j 0.3 0.2 0.4 0.1

Laplasa kritērijs.
Ja dabas stāvokļu iespējamības ir ticamas, to novērtēšanai tiek izmantots Laplasa nepietiekamā saprāta princips, saskaņā ar kuru tiek pieņemts, ka visi dabas stāvokļi ir vienlīdz ticami, t.i.:
q 1 = q 2 = ... = q n = 1/n.
q i = 1/4
A iP 1P 2P 3P 4∑(a ij)
A 1 8.25 2.5 5 6.63 22.38
A 2 12.5 16.75 2.88 6.25 38.38
A 3 5.88 8.75 10 14.63 39.25
p j 0.25 0.25 0.25 0.25
Secinājums: izvēlieties stratēģiju N=3.
Valda kritērijs.
Saskaņā ar Valda kritēriju par optimālu tiek pieņemta tīra stratēģija, kas sliktākajos apstākļos garantē maksimālo ieguvumu, t.i.
a = max(min a ij)
Valda kritērijs koncentrē statistiku uz visnelabvēlīgākajiem dabas stāvokļiem, t.i. šis kritērijs pauž pesimistisku situācijas novērtējumu.
A iP 1P 2P 3P 4min(a ij)
A 1 33 10 20 26.5 10
A 2 50 67 11.5 25 11.5
A 3 23.5 35 40 58.5 23.5
Secinājums: izvēlieties stratēģiju N=3.
Mežonīgs kritērijs.
Savage minimālā riska kritērijs iesaka izvēlēties optimāla stratēģija tāds, kurā maksimālā riska lielums tiek samazināts līdz minimumam sliktākajos apstākļos, t.i. ar nosacījumu:
a = min(maks. r ij)
Sevidža kritērijs koncentrē statistiku uz visnelabvēlīgākajiem dabas stāvokļiem, t.i. šis kritērijs pauž pesimistisku situācijas novērtējumu.
Mēs atrodam riska matricu.
Risks– neatbilstības mērs starp dažādiem iespējamajiem konkrētu stratēģiju pieņemšanas rezultātiem. Maksimālais pastiprinājums j-tajā kolonnā b j = max(a ij) raksturo labvēlīgo dabas stāvokli.
1. Aprēķināt riska matricas 1. aili.
r 11 = 50 - 33 = 17; r 21 = 50 - 50 = 0; r 31 = 50 - 23,5 = 26,5;
2. Aprēķināt riska matricas 2. aili.
r 12 = 67 - 10 = 57; r 22 = 67 - 67 = 0; r 32 = 67 - 35 = 32;
3. Aprēķināt riska matricas 3. aili.
r 13 = 40 - 20 = 20; r 23 = 40 - 11,5 = 28,5; r 33 = 40 - 40 = 0;
4. Aprēķināt riska matricas 4. aili.
r 14 = 58,5 - 26,5 = 32; r 24 = 58,5 - 25 = 33,5; r 34 = 58,5 - 58,5 = 0;
A iP 1P 2P 3P 4
A 1 17 57 20 32
A 2 0 0 28.5 33.5
A 3 26.5 32 0 0

A iP 1P 2P 3P 4max(a ij)
A 1 17 57 20 32 57
A 2 0 0 28.5 33.5 33.5
A 3 26.5 32 0 0 32
Secinājums: izvēlieties stratēģiju N=3.
Hurvica kritērijs.
Hurvica kritērijs ir pesimisma – optimisma kritērijs. Par optimālo stratēģiju tiek uzskatīta tāda, kurai ir šāda sakarība:
max(i)
kur s i = y min(a ij) + (1-y)max(a ij)
Ja y = 1 mēs iegūstam Walde kritēriju, y = 0 mēs iegūstam optimistisko kritēriju (maksimums).
Hurwitz kritērijs ņem vērā gan ļaunākās, gan labākās dabas uzvedības iespējamību cilvēkiem. Kā tevi izvēlas? Kā sliktākas sekas kļūdainu lēmumu gadījumā, jo lielāka ir vēlme apdrošināties pret kļūdām, jo ​​tuvāk y ir 1.
Mēs aprēķinām s i.
s 1 = 0,5 10+(1-0,5) 33 = 21,5
s 2 = 0,5 11,5 + (1-0,5) 67 = 39,25
s 3 = 0,5 23,5 + (1-0,5) 58,5 = 41
A iP 1P 2P 3P 4min(a ij)max(a ij)y min(a ij) + (1-y)max(a ij)
A 1 33 10 20 26.5 10 33 21.5
A 2 50 67 11.5 25 11.5 67 39.25
A 3 23.5 35 40 58.5 23.5 58.5 41
Secinājums: izvēlieties stratēģiju N=3.
Tādējādi lēmuma rezultātā statistikas spēle Pēc dažādiem kritērijiem stratēģija A 3 tika ieteikta biežāk nekā citas.

Uzņēmuma vadība nolemj izvietot jaunā produkta ražošanu noteiktā vietā. Lai radītu priekšstatu par situāciju jauna produkta tirgū ražošanas apgūšanas brīdī, ir jāņem vērā gatavās produkcijas piegādes patērētājam izmaksas, transporta un sociālās infrastruktūras attīstība. reģions, konkurence tirgū, attiecības starp piedāvājumu un pieprasījumu, valūtas kursi un daudz kas cits. Iespējamie varianti lēmumi, kuru investīciju pievilcība tiek definēta kā ienākumu pieauguma procents attiecībā pret kapitālieguldījumu apjomu, atspoguļoti tabulā.
Izvēlieties:
1) ražošanas izvietošanas vieta, ja uzņēmuma vadītājs ir pārliecināts, ka tirgū izveidosies 4. situācija;
2) vieta ražošanas izvietošanai, ja vadība lēš, ka 1.situācijas iespējamība ir 0,2; situācijas 2 in 0,1; 3. situācija pulksten 0,25;
3) izvēlieties opciju nenoteiktības apstākļos pēc kritērija: maximax, maximin, Laplasa kritērijs, Savage kritērijs, Hurwitz kritērijs (y = 0,3);
4) vai tas mainīsies labākais variants risinājumus saskaņā ar Hērvica kritēriju, ja a vērtību palielina līdz 0,5?
5) pieņemot, ka tabulas dati atspoguļo uzņēmuma izmaksas, noteikt izvēli, ko uzņēmums izdarīs, izmantojot katru no šādiem kritērijiem: maksimums; maximax; Hērvica kritērijs(? = 0,3); Savage kritērijs; Laplasa kritērijs

Varētu pieņemt, ka atradnes ir vienmērīgi sadalītas visā teritorijā. Šo pieeju diez vai var uzskatīt par likumīgu, jo ar tās palīdzību iegūtajiem secinājumiem nav loģiska pamata. Tomēr Bayes-Laplace kritērijs nav patvaļīgāks par Hurwitz kritēriju.


Optimistiskā pieeja, pieejas, kuru pamatā ir Hērvica kritērijs, Beiisa-Laplasa kritērijs un Savage kritērijs šajā gadījumā nākamais skats

Bajesa (Laplasa) kritērijs 27, 224 Beijesa pieeja 27 Līdzsvars 27 Līdzsvarošana (vai līdzsvars)

Starp šiem kritērijiem un noteikumiem īpašu vietu ieņem noteikumi un kritēriji, kuru pamatā ir labi zināmā Beijesa teorēma. Uz šo teorēmu balstīta pieeja ļauj, pirmkārt, izmantot dažus dabaszinātņu metodiskos principus vadīšanā, otrkārt, nodrošināt spriedumu un lēmumu pieņemšanas koriģēšanu, gūstot pieredzi. Pēdējais nozīmē mācīšanos vadīt (lēmumu pieņemšanas nozīmē) pašā vadības procesā.

Dažreiz operācijas laikā nenoteiktība atklājas pakāpeniski, kad informācija kļūst pieejama. Šajā gadījumā, lai pamatotu lēmumus, ir ērti izmantot tādu objektīvu kritēriju kā notikuma posterior varbūtība. Šo varbūtību visvieglāk var aprēķināt, izmantojot Bayes formulu izredžu izteiksmē. Apskatīsim šīs pieejas būtību.

Bayes kritēriju izmanto gadījumos, kad ir zināms iespējamo stāvokļu varbūtības sadalījums. Ja šo diskrēto varbūtību sadalījumu nosaka varbūtību kopa, tad saskaņā ar Beijesa kritēriju stratēģijai Si ir priekšroka Sj (s > ja

Īpaši šī kritērija gadījumi ir Beijesa kritērijs (A = 1) un Valda kritērijs (A = 0).

Bayes-Laplace kritērijs, atšķirībā no Wald kritērija, ņem vērā visas iespējamās sekas no visiem lēmuma variantiem.

Bayes-Laplace kritērijs izvirza šādas prasības situācijai, kurā tiek pieņemts lēmums:

Ja z = 1, kritērijs tiek pārveidots par Beiisa-Laplasa kritēriju, un, ja z = O, tas tiek pārveidots par Valda kritēriju. Tādējādi z parametra izvēle ir pakļauta subjektivitātei. Turklāt ieviešanu skaits paliek bez uzraudzības. Tāpēc šis kritērijs tiek reti izmantots, pieņemot tehniskus lēmumus.

Mēs pētījām vairākas pamata pieejas lēmumu pieņemšanai nenoteiktu faktoru gadījumā pētāmajā modelī. Varat minēt piemērus, kad visi lēmuma pieņemšanas kritēriji noved pie viena un tā paša risinājuma izvēles x e X, bet parasti tas nenotiek, katrs kritērijs noved pie sava lēmuma (šāda veida piemērs ir apskatīts nākamajā nodaļā). Tāpēc rodas diskusijas par to, kurš kritērijs ir vēlams un kad. tiek mēģināts izveidot vienu, pamatojoties uz vairākiem kritērijiem. Jo īpaši Hurwitz kritērijs ir šāda divu kritēriju kombinācija. Ir arī mēģināts apvienot Hurvtz kritēriju un Bayes-Laplace kritēriju. Visiem iegūtajiem kritērijiem ir augsta patvaļas pakāpe. Mūsuprāt, vienīgais veids, kā šīs grūtības pārvarēt, ir daudzkritēriju pieeja, kurā lēmuma pieņēmējs varētu apsvērt no indikatoru kopuma viedokļa efektīvus lēmuma variantus un izvēlēties no tiem piemērotāko. viņiem. Šī pieeja tiek izmantota nākamajā nodaļā sniegtajā piemērā. Protams, rādītāju kopumam nevajadzētu būt pārāk lielam.

Parasti tiek izmēģinātas vairākas konfigurācijas atšķirīgs numurs elementi un savienojumu struktūra. Viens no visvairāk svarīgi rādītāji ir treniņu komplekta apjoms un vispārināšanas spējas nodrošināšana turpmākajā darbā, un vēlamo rezultātu var sasniegt dažādas shēmas. Visbiežāk izmantotās procedūras ir secīgā nolaišanās (ar apstiprinājuma komplektu) vai N-kārtīga krusteniskā validācija. Var piemērot arī jaudīgākus informācijas kritērijus (1) vispārināto savstarpējo validāciju (GV), galīgo Akaike prognozēšanas kļūdu (FPE), Bayes kritērijus (BI) un Akaike kritērijus (AI) (sk. ). Lai uzlabotu vispārināšanas spējas un novērstu pārmērības risku, tiek izmantota arī svara samazināšana un likvidēšana (koku retināšana). Tajā pašā laikā tiek mainīta tīkla arhitektūra, noņemti daži savienojumi un tiek pētīta to ietekme uz efektivitāti. >,

BEISA (LAPLACE) KRITĒRIJS - lēmumu teorijā kritērijs lēmumu pieņemšanai, ja nav informācijas par “dabas” stratēģiju relatīvajām varbūtībām. (Skatīt Nenoteiktas problēmas.) Saskaņā ar B.(L.)k. Tiek ierosināts piešķirt vienādas varbūtības visām aplūkotajām stratēģijām un pēc tam pieņemt to, kurai ir vislielākā paredzamā peļņa. Tā mīnuss ir tas, ka vienā un tajā pašā problēmā izvērtējamo alternatīvu klāsts var būt dažāds un attiecīgi arī katras no tām relatīvā varbūtība var būt atšķirīga.

Hodža-Lehmana kritērijs. Īstenojot šo kritēriju, tiek izmantoti divi subjektīvie rādītāji: pirmkārt, Beijesa kritērijā izmantotais varbūtības sadalījums un, otrkārt, “optimisma parametrs” no Hērvica kritērija.

Hodža-Lēmana kritērijs vienlaikus ir balstīts uz Wald un Bayes-Laplace kritērijiem

Meklējot optimālos risinājumus, viņi parasti izmanto dažādi kritēriji, sniedzot kādu lēmumu pieņemšanas shēmu. Apskatīsim dažus no tiem.

Beijesa kritērijs. Lietojot Beijesa kritēriju, statistiķis zina notikuma P k iestāšanās varbūtības q k. Parasti varbūtības q k nosaka, veicot eksperimentus. Šādas varbūtības sauc par posterior. Tīrā stratēģija tiek pieņemta kā optimāla saskaņā ar Beijesa kritēriju A i, pie kura vidējā laimesta statistika kļūst maksimāla.

Laplasa kritērijs. Laplasa kritērijs atšķiras no Beijesa kritērija ar to, ka aizmugures varbūtības nav zināmas. Tad tos ņem vienādi un aprēķina, izmantojot formulu

Mežonīgs kritērijs. Šis kritērijs ir ārkārtēja pesimisma kritērijs, t.i. statistiķis sāk no pieņēmuma, ka daba pret viņu rīkojas vissliktākajā iespējamajā veidā. Savage kritērijs iesaka kā optimālu izvēlēties to tīro stratēģiju A i, pie kuras maksimālais risks ir minimāls. Šo risku sauc par minimumu, un to aprēķina pēc formulas

Valda kritērijs. Tāpat kā Savage kritērijs, arī Valda kritērijs ir ārkārtēja pesimisma kritērijs. Tāpēc statistiķis izvēlas tīru stratēģiju A, lai mazākā peļņa būtu maksimālā. Šo pieaugumu sauc par maksimumu un aprēķina pēc formulas

Hurvica kritērijs. Šis kritērijs ir pesimisma-optimisma kritērijs un iesaka lietot kaut ko pa vidu. Šajā gadījumā statistiķis izvēlas tīru stratēģiju A i, uz kuru attiecas šāds nosacījums:

kur γ=0÷1 ir izvēlēts no subjektīviem apsvērumiem. Ja γ = 1, Hurvica kritērijs tiek pārveidots par Valda kritēriju.

Piemērs 4.6. Tiek veidota studija televizoru remontam stacionāra apstākļi. Vienkāršības labad pieņemam, ka remontdarbu pieprasījumu plūsma ir izteikta ar skaitļiem 2, 4, 6 un 8 tūkstoši pieteikumu gadā. No pieredzes zināms, ka peļņa no viena televizora remonta ir 9 den. vienības gadā. Zaudējumi, kas radušies remonta neizdarības dēļ jaudas trūkuma dēļ - 5 den. vienības Zaudējumi no speciālistu un aprīkojuma dīkstāves, ja nav iesniegti pieteikumi - 6 dienas. vienības katram pieteikumam.



Sniegt informāciju par topošās studijas kapacitāti, izmantojot dotos kritērijus.

Risinājums. Spēlētājs A šeit ir struktūra, kas pieņem lēmumus par izveidotās studijas kapacitāti. Viņa tīrās stratēģijas ir:

■ A 1 - studijas atvēršana ar jaudu 2 tūkstoši televizoru gadā;

§ A 2 - studijas atvēršana ar jaudu 4 tūkstoši televizoru gadā;

■ A 3 - studijas atvēršana ar jaudu 6 tūkstoši televizoru gadā;

■ A 4 - studijas atvēršana ar jaudu 8 tūkstoši televizoru gadā.

Otrs spēlētājs ir visu apstākļu kopums, kādos veidojas pieprasījumu plūsma par TV remontu studijā, t.i. daba P. Daba var realizēt jebkuru no četriem stāvokļiem:

P 1- plūsma būs 2 tūkstoši televizoru gadā;

■ P g - plūsma būs 4 tūkstoši televizoru gadā;

P 3- plūsma būs 6 tūkstoši televizoru gadā;

§ P 4- plūsma būs 8 tūkstoši televizoru gadā.

Aprēķināsim spēlētāja A izmaksas a ik jebkurā apstākļu kombinācijā ( A i , P k). Vislabvēlīgākās situācijas būs tad, kad saņemto pieteikumu skaits sakritīs ar studijas iespējām.

Kombinācijai ( A 1, P 1) peļņa būs 11 = 2 * 9 = 18 tūkst. vienības, kombinācijai ( A 2, P 2) mums ir 22 = 4 * 9 = 36 tūkstoši den. vienības utt.

Gadījumam ( A 1, P 2) studijā var remontēt 2 tūkstošus televizoru, un tika saņemti 4 tūkstoši pieteikumu Zaudējumi šajā gadījumā būs 2 * 5 = 10 tūkstoši. vienību, un kopējā peļņa a n =2*9-2*5=8 tūkst.den. vienības

Gadījumam ( A i , P k) studijā var remontēt 4 tūkstošus televizoru, un tika saņemti 2 tūkstoši pieteikumu Zaudējumi šajā gadījumā būs 2 * 6 = 12 tūkstoši. vienību, un kopējā peļņa a 21 = 18-12 = 6 tūkstoši den. vienības Līdzīgi ir atrodami arī citi maksājumu matricas elementi. Aprēķinu rezultāti ir parādīti tabulā. 4.13.

No galda 4.13 no tā izriet, ka spēles zemākā neto cena

un spēles augšējā neto cena

Tā kā α ≠ β, spēle nesatur seglu punktu. Statistiķim nav dominējošu stratēģiju.________________

Beijesa kritērijs. Dabas stāvokļa P k varbūtības q k ir zināmas Tabulā. 4.13. šīs varbūtības ir apzīmētas kā . Izmantojot formulu (4.23), mēs atrodam vidējo laimestu vērtības. Šīs vērtības ir norādītas tabulas septītajā slejā. 4.13. Kā optimāla pēc Beijesa kritērija tiek pieņemta tīrā stratēģija A 3 (atvērt darbnīcu 6 tūkst. remontu gadā), kurā vidējais ieguvums ir statistika. .

4.13. tabula

P 1(2) P 2(4) P 3(6) P 4(8) αi 0,8α i δi 0,2δi Sveiki
A 1 (2) -2 -12 -12 3,5 -9,6 3,6 -6
A 2 (4) 23,5 4,8 7,2
A 3 (6) -6 -6 29,5 -4,8 10,8
A 4 (8) -18 -18 25,5 -14,4 14,4
β i
0,2 0,35 0,25 0,2
0,25 0,25 0,25 0,25

Šeit tiek izmantoti šādi apzīmējumi:

Laplasa kritērijs. Saskaņā ar šo kritēriju varbūtības tiek pieņemtas vienādas un aprēķinātas, izmantojot formulu

Tīrā stratēģija A 3 arī tiek pieņemta par optimālu pēc Laplasa kritērija, kurai vidējās izmaksas statistika

Mežonīgs kritērijs. Lai analizētu spēli, izmantojot šo metodi, mēs izveidosim riska matricu. Aprēķiniem tiek izmantotas formulas (4.21), (4.22). Aprēķinu rezultāti ir parādīti tabulā. 4.14.

Kā izriet no tabulas. 4.14, visu maksimālo risku minimums ir vienāds ar . Šis risks atbilst tīrai stratēģijai A 3 (atvērt darbnīcu 6 tūkstošiem remontdarbu gadā).

4.14. tabula

P 1 P 2 P 3 P 4 maks rik
A 1
A 2
A 3
A 4

Valda kritērijs. No galda 4.13 ir skaidrs, ka zemāka spēles neto cena . Šī cena atbilst tīrajai A g stratēģijai (atvērt studiju uz 4 tūkstošiem remontdarbu gadā).

Hurvica kritērijs. Liksim γ = 0,8. Mēs aprēķinām, izmantojot formulu δi= max a ik (sk. 4.13. tabulas 10. aili). Pēc tam, izmantojot tabulas 6. un 10. ailē esošos datus. 4.13, mēs veicam aprēķinu, izmantojot formulu.

Rezultāts ir parādīts tabulas 12. ailē. 4.13. Nozīme un atbilst stratēģijai A 2(atvērt studiju 4 tūkst. remontam gadā).

Laplasa kritērijs

Vairākos gadījumos ticams šķiet šāds arguments: tā kā turpmākie dabas stāvokļi nav zināmi, tos var uzskatīt par vienlīdz ticamiem. Šī risinājuma pieeja tiek izmantota Laplasa “nepietiekama iemesla” kritērijā.

Lai atrisinātu problēmu, katram risinājumam tiek aprēķināta ieguvuma matemātiskā cerība (dabas stāvokļu varbūtības tiek pieņemtas vienādas ar qj = 1/n, j = 1:n), un tiek izvēlēts risinājums, kurā šī pastiprinājuma vērtība ir maksimālā.

Hipotēze par dabas stāvokļu līdzsvarotību ir diezgan mākslīga, tāpēc Laplasa principu var izmantot tikai ierobežotos gadījumos. Vairāk vispārējs gadījums jāpieņem, ka dabas stāvokļi nav vienlīdz iespējami, un risināšanai jāizmanto Beijesa-Laplasa kritērijs.

Bayes-Laplace kritērijs

Šis kritērijs atkāpjas no pilnīgas nenoteiktības nosacījumiem – tas pieņem, ka iespējamiem dabas stāvokļiem var piešķirt noteiktu to rašanās varbūtību un, noteicis matemātisko ieguvuma cerību katram lēmumam, izvēlas to, kas nodrošina vislielāko ieguvuma vērtību:

Šī metode paredz iespēju izmantot jebkuru provizorisku informāciju par dabas stāvokļiem. Tas paredz gan dabas stāvokļu atkārtojamību, gan lēmumu atkārtojamību un, galvenais, pietiekami ticamu datu pieejamību par pagātnes dabas stāvokļiem. Tas ir, pamatojoties uz iepriekšējiem novērojumiem, prognozēt turpmāko dabas stāvokli (statistikas princips).

Atgriežoties pie mūsu 1. tabulas, pieņemsim, ka q1=0,4, q2=0,2 un q3=0,4. Pēc tam saskaņā ar Bayes-Laplace kritēriju mēs papildinām 1. tabulu ar matemātisko gaidu kolonnu un no šīm vērtībām izvēlamies maksimumu. Mēs iegūstam 13. tabulu.

13. tabula.

Optimālais risinājums ir X1.

Bayes-Laplace kritērijs izvirza šādas prasības situācijai, kurā tiek pieņemts lēmums:

  • v stāvokļu Bj rašanās varbūtības ir zināmas un nav atkarīgas no laika;
  • v risinājums tiek realizēts (teorētiski) bezgalīgi daudz reižu;
  • v nelielam risinājuma ieviešanas gadījumu skaitam zināms risks ir pieņemams.

Ar pietiekami lielu ieviešanu skaitu vidējā vērtība pakāpeniski stabilizējas. Tāpēc ar pilnīgu (bezgalīgu) ieviešanu jebkurš risks tiek novērsts.

Lietotāja sākotnējā pozīcija - kritērijs ir optimistiskāks nekā Valda kritērija gadījumā, tomēr tas paredz vairāk augsts līmenis izpratne un pietiekami ilgas ieviešanas.

Uzskaitītie kritēriji neizsmeļ risinājuma izvēles kritērijus nenoteiktības apstākļos, jo īpaši labāko jaukto stratēģiju izvēles kritērijus, tomēr ar to pietiek, lai risinājuma izvēles problēma kļūtu neskaidra:

14. tabula. Optimālās iespējas, kas iegūtas, izmantojot dažādus kritērijus

No 14. tabulas ir skaidrs, ka optimālā risinājuma izvēle ir atkarīga no izvēlētā kritērija (un galu galā arī no pieņēmumiem).

Kritērija izvēle (kā arī optimāluma principa izvēle) ir grūtākais un svarīgākais uzdevums lēmumu pieņemšanas teorijā. Taču konkrēta situācija nekad nav tik nenoteikta, lai nebūtu iespējams iegūt kaut daļēju informāciju par dabas stāvokļu varbūtības sadalījumu. Šajā gadījumā pēc dabas stāvokļu varbūtības sadalījuma novērtēšanas tiek izmantota Bayes-Laplace metode, vai arī tiek veikts eksperiments, lai noskaidrotu dabas uzvedību.

Tā kā dažādi kritēriji ir saistīti ar dažādiem apstākļiem, kādos tiek pieņemts lēmums, vislabākais veids, kā salīdzināt noteiktu kritēriju ieteikumus, ir iegūt papildu informāciju par pašu situāciju. Jo īpaši, ja tiek pieņemts lēmums par simtiem mašīnu ar vienādiem parametriem, ieteicams izmantot Bayes-Laplace kritēriju. Ja mašīnu skaits nav liels, labāk izmantot minimax vai Savage kritērijus.

Problēmu risināšanas formulējumu piemēri

Šajā sadaļā, izmantojot uzdevumu risināšanas piemēru, jāiemācās noteikt stratēģiju vektoru, stāvokļu vektoru un maksājumu matricu un piemērot dažādus kritērijus optimālā risinājuma iegūšanai.

Uzdevums. Piejūras pilsētiņā tika nolemts atvērt jahtklubu. Cik jahtas jāiegādājas (pamatojoties uz: viena jahta uz 5 personām), ja paredzamais kluba biedru skaits svārstās no 10 līdz 25 cilvēkiem. Gada abonements maksā 100 valūtas vienības. Jahtas cena ir 170 naudas vienības. Telpu noma un jahtu uzglabāšana izmaksā 730 naudas vienības gadā.

Risinājums. Neapšaubāmi, ir jēga ņemt vērā iegādājamo jahtu skaitu diapazonā no divām līdz piecām (4 varianti) un potenciālo jahtu skaitu no 10 līdz 25. Lai samazinātu uzskaites apjomu, aprobežosimies ar 10. variantu. , 15, 20, 25 (ja iegūtie secinājumi par saistītajiem variantiem būtiski atšķiras, veiksim papildus precizējošu aprēķinu). Tātad: X= (Xi) = (2, 3, 4, 5) - jahtu skaits (i=1,2,3,4); B = (Bj) =(10, 15, 20, 25) - jahtkluba dalībnieku skaits (j=1,2,3,4).

Lai sāktu risinājuma meklējumus, konstruēsim lēmumu matricu, kuras elementi uzrāda peļņu, pieņemot i-to lēmumu ar j-to jahtkluba biedru skaitu:

aij = 100 min (5 Xi ; Bj) — 170 Xi — 730

tie. izšķirošais noteikums mūsu problēmā tas ir formulēts kā "ienākumi - izmaksas".

Pēc vienkāršu aprēķinu veikšanas aizpildīsim lēmumu matricu (aij) (skat. 15. tabulu):

teorijas spēles matricas risinājums

15. tabula. Maksājumu matrica

Piemēram, a11 = 100 min(52, 10) - 1702-730 =-70

a12=100min(52,15)-1702-730=-70

a13 = a14 = -70 (pieprasījums pēc jahtām paliks neapmierināts). Negatīvās vērtības liecina, ka ar šīm jahtām pieprasījuma un to pieejamības attiecībām jahtklubs cieš zaudējumus.

Valda kritērijs (piesardzīgas, pesimistiskas stratēģijas izvēle) - katrai alternatīvai (jahtu skaits klubā) tiek izvēlēta sliktākā situācija ( mazākā vērtība peļņas apjoms) un starp tiem tiek atrasts garantētais maksimālais efekts:

ZMM=maks.(-70; -240; -410; -580)=-70

Secinājums: pieņemot lēmumu, izmantojot Wald kritēriju, jahtklubam ir jāiegādājas 2 jahtas un maksimālais paredzamais zaudējums nepārsniegs 70 CU.

Hurwitz kritērijs (kompromisa risinājums starp sliktāko iznākumu un pārāk optimistisku). Apskatīsim mūsu problēmas risinājuma izmaiņas atkarībā no optimisma koeficienta vērtībām (16. tabulā vērtības, kas atbilst Hurvica kritērijam, ir izceltas dažādām vērtībām):

16. tabula. Hurwitz risinājumi dažādiem

Secinājums: par 0,5 jums vajadzētu iegādāties 5 jahtas un gaidīt peļņu aptuveni 170 rubļu apmērā. (ceram uz mūsu kluba plašo popularitāti un zināmu amatieru finansiālo dzīvotspēju), pie = 0,2 nevajadzētu pirkt vairāk kā 2 jahtas (prognozēs esam piesardzīgāki un, visticamāk, dosimies priekšroku atteikumam izveidot jahtas). klubs).

Savage kritērijs (minimālā riska atrašana). Izvēloties risinājumu, pamatojoties uz šo kritēriju, lietderības matrica vispirms tiek salīdzināta ar nožēlas matricu D - mūsu piemēram, no lietderības matricas pirmās kolonnas atņemot (-70), no otrās kolonnas 260, 590 un 920 no trešās un ceturtās kolonnas attiecīgi iegūstam riska matricu (sk. 17. tabulu):

17. tabula. Riska matrica

Mazākā vērtība starp maksimālajiem rindas elementiem (tabulā iezīmētās vērtības) ir vienāda ar:

ZS=min(990; 660; 340; 510)=340

Secinājums: iegādājoties 4 jahtas jahtklubam, kuru atveram, esam pārliecināti, ka sliktākajā gadījumā kluba zaudējumi nepārsniegs CU 340.

Bayes-Laplace lēmuma kritērijs. Pieņemsim, ka ir statistikas dati, kas ļauj novērtēt konkrēta pieprasījuma iespējamību pēc dalības jahtklubā: q=(0,1; 0,2; 0,4; 0,3). Tad peļņas vērtības matemātiskā cerība katram no aplūkotajiem risinājuma variantiem (jahtu piegāde jahtklubā):

a1r = (-700.1)+(-700.2)+(-700.4)+(-700.3) =-70,

a2r= (-2400.1)+(2600.2)+(2600.4)+(2600.3) =210;

a3r = 390; a4r = 370.

Secinājums: aplūkojamās situācijas apstākļos vēlams iegādāties 4 jahtas (šajā gadījumā maksimālā sagaidāmā jahtkluba peļņa būs 390 naudas vienības).

Lai piemērotu Laplasa kritēriju, mēs atrodam:

a1r = ((-70)+(-70)+(-70)+(-70)) / 4 = -70 ;

a2r = ((-240)+(260)+(260)+(260)) / 4 =135;

a3r = 215; a4r = 170.

Secinājums: ar vienādu iespējamību, ka radīsies viens vai otrs pieprasījums pēc dalības jahtklubā, jums jāiegādājas 4 jahtas un tajā pašā laikā varat rēķināties ar peļņu CU 215 apmērā.

Vispārīgs secinājums. Apsvērtie kritēriji ļauj pieņemt dažādus lēmumus un tādējādi dod vielu pārdomām ( lēmumušeit būs būtiski atkarīgs no lēmuma subjekta psiholoģijas un intuīcijas). Tas nav pārsteidzoši, jo kritēriji ir balstīti uz dažādām hipotēzēm. Ieviešot vienu vai otru hipotēzi par vides uzvedību, mēs tādējādi “noņemam nenoteiktību”, bet pati hipotēze ir tikai pieņēmums, nevis zināšanas. Būtu dīvaini, ja dažādi pieņēmumi vienmēr novestu pie viena un tā paša rezultāta.

Lēmumu pieņemšana pakļauta riskam

Kā minēts iepriekš, lēmumu pieņemšanu riska apstākļos raksturo tas, ka dabas (vides) uzvedība ir nejauša. Tas izpaužas faktā, ka pastāv zināms varbūtības mērs, saskaņā ar kuru rodas (rodas) noteikti dabas stāvokļi. Tajā pašā laikā seja Dotajam risinājumam ir noteikta informācija par vides stāvokļu rašanās varbūtībām, kas pēc būtības var būt ļoti dažādas. Piemēram, ir trīs vides stāvokļi B1, B2 un B3, tad papildu informācija par šo stāvokļu rašanos var būt tāda, ka stāvoklis B1 ir vismazākais un stāvoklis B3 ir vairāk ticams.

Līdz ar to lēmumu pieņemšana riska apstākļos paredz papildus ieviešanas funkcijas precizēšanai arī dažus Papildus informācija par vides stāvokļa varbūtībām. Ja dabas stāvokļu kopa B ir ierobežota (stāvokļu skaits ir vienāds ar m), tad varbūtības mēru uz tās var norādīt ar varbūtības vektoru q=(q1, q2, …, qm), kur qj?0 un.

Tādējādi izmaksu matricu riska apstākļos var attēlot šādi (skat. 1. tabulu)

Vides stāvokļi

Izvēloties risinājumu Xi, spēlētājs zina, ka saņems vienu no izmaksām a11, ..., a1m ar varbūtībām attiecīgi q1, ..., qm. Līdz ar to iznākums lēmumu pieņēmējam, izvēloties risinājumu Xi, ir nejaušs mainīgais

Tātad, salīdzinot divus risinājumus X1 un X2, jāsalīdzina tiem atbilstošie nejaušie mainīgie.

Optimālā risinājuma izvēle parasti balstās uz vienu no šādiem kritērijiem:

  • 1) Bayes-Laplace kritērijs - paredzamā vērtība (peļņa vai izdevumi);
  • 2) paredzamās vērtības un dispersijas kombinācijas;
  • 3) produkta kritērijs;
  • 4) visticamākais notikums nākotnē un citi.

Apskatīsim tuvāk Bayes-Laplace kritēriju.

Paredzamās vērtības tests (Bayes-Laplace tests)

Pēdējā lekcijā apskatījām Beijesa-Laplasa kritēriju. Šī kritērija izmantošana (cits nosaukums ir atrodams literatūrā - "paredzamās vidējās vērtības" kritērijs) ir saistīts ar vēlmi maksimāli palielināt paredzamo peļņu (vai minimizēt paredzamās izmaksas). Paredzamo vērtību izmantošana nozīmē iespēju atkārtoti atrisināt vienu un to pašu problēmu, līdz tiek iegūtas pietiekami precīzas vērtības. aprēķinu formulas. Matemātiski tas izskatās šādi: lai o ir gadījuma lielums ar matemātisko gaidu Mo un dispersiju Do. Ja x1, x2,..., xn ir vērtības nejaušais mainīgais(s.v.) ak, tad to (izlases vidējo) vērtību vidējais aritmētiskais

ir dispersija. Tādējādi, kad n>

Citiem vārdiem sakot, ar pietiekami lielu izlases lielumu starpība starp vidējo aritmētisko un matemātisko cerību tiecas līdz nullei (tā sauktā varbūtības teorijas robežteorēma). Līdz ar to “paredzamās vērtības” kritērija izmantošana ir spēkā tikai tādā gadījumā, ja viens un tas pats risinājums jāpiemēro pietiekami daudz reižu. Ir arī pretējais: koncentrēšanās uz cerībām novedīs pie nepareiziem rezultātiem lēmumiem, kas jāpieņem dažas reizes.

Pirms pāriet pie Bayes-Laplace kritērija modificēšanas, aplūkosim šo kritēriju sīkāk.

Ir zināms, ka gadījuma lieluma o dabiskais skaitliskais raksturlielums ir tā matemātiskā gaida Mo, kurai šī nejaušā lieluma vidējā vērtība tuvojas daudzos testos.

Ja cilvēkam, kurš iestājas pret dabu, ir statistikas dati par modeļiem konkrētās dabas izpausmēs, tad problēmu var viegli atrisināt ar varbūtības metodēm.

Tātad, ja dabas stāvokļu iespējamības ir zināmas un laika gaitā nemainās (stacionāras), tad risinājumam, kas maksimāli palielina sagaidāmo ieguvumu (kas dod vislielākās matemātiskās ieguvuma cerības pret zināmu dabas stratēģiju – stāvokli vai stāvokli) uzskatīt par optimālu.

Piemērs. Uzņēmums iegādājās mašīnu par 100 naudas vienībām. Lai to salabotu, var iegādāties speciālu aprīkojumu 50 vienībām. vai iztikt ar veco aprīkojumu. Ja mašīna sabojājas, tās remonts ar speciālā aprīkojuma palīdzību maksā 10 vienības, bez speciālā aprīkojuma - 40 vienības. Ir zināms, ka tā kalpošanas laikā mašīna sabojājas ne vairāk kā trīs reizes: varbūtība, ka iekārta nesaplīsīs, ir 0,3; pārtraukumi 1 reizi - 0,4; pārtraukumi 2 reizes - 0,2; pārtraukumi 3 reizes - 0,1. Ir nepieciešams noteikt specializētā remonta aprīkojuma iegādes iespējamību.

Formalizācija. Pirmajam spēlētājam ir divas tīras stratēģijas: pirkt (X1) un nepirkt (X2) specializēto remonta aprīkojumu. Dabai, otrajam spēlētājam, ir četri stāvokļi: iekārta neizdosies, neizdosies vienu reizi, salūzīs divas reizes un salūzīs trīs reizes. Izmaksas funkcija ir uzņēmuma izmaksas mašīnas iegādei un remontam, kas norādītas maksājumu matricā (skat. 1. tabulu):

1. tabula.

Mašīnas kļūme

B1, nekad

X1, nepērc

X2, pērc

Risinājums. Vispirms aplūkosim šo problēmu kā antagonistisku spēli. Izmantojot minimax metodi, matricā atrodam seglu punktu: (X2, B4), līdz ar to spēles cena ir v= - 180 naudas vienības (skat. 2. tabulu).

2. tabula.

Mašīnas kļūme

B1, nekad

X1, nepērc

X2, pērc

Atbilde: jums ir jāiegādājas specializēts aprīkojums.

Taču spēlēs ar dabu situācija radikāli mainās: nosacījums jau satur stabilu jauktu dabas stratēģiju: q = (0,3; 0,4; 0,2; 0,1) un mēs zinām, ka daba pieturas pie šīs stratēģijas.

Ja cilvēks – pirmais spēlētājs – turpinās spēlēt optimāli, tad viņa izmaksa būs M=-150Х0.3-160Ч0.4-170Ч0.2-180Ч0.1=-161, un, ja viņš izmantos pirmo, neoptimālā. stratēģiju, tad viņa matemātiskā cerība laimests būs M=-100Х0.3 - 140Х0.4 - 180Х0.2 -220Х0.1 =-144.

Tādējādi pirmajam spēlētājam ir izdevīgi spēlēt neoptimāli!

3. tabula.

Mašīnas kļūme

B1, nekad

X1, nepērc

X2, pērc

Atbilde: nepērciet specializētu aprīkojumu.

Būtiskā atšķirība starp v(x*) un v(x) vērtībām ir izskaidrojama ar to, ka dabas jauktā stratēģija nav optimāla un, “atkāpjoties” no tās optimālās stratēģijas, tā “zaudē” 36 laimestu naudas vienības.

Tātad spēlē ar dabu orientācija uz matemātisko laimesta cerību patiesībā ir orientācija uz vidējo laimestu, kas tiks iegūts, šo spēli atkārtojot daudzas reizes (pieņemot, ka spēles apstākļi nemainās). Protams, ja spēle patiešām tiek atkārtota daudzas reizes, tad vidējā ieguvuma kritēriju (piemēram, ekonomiskajās problēmās - vidējā peļņa) var uzskatīt par pamatotu. Tomēr vai ir saprātīgi koncentrēties uz šo kritēriju vienā pārbaudē?

Apsveriet šādu piemēru. Firma I varu izlikt pārdošanai vienu no precēm TI1 vai TI2, un firma II var piedāvāt kādu no precēm TII1, TII2, TII3. Preces TI1 un TII1 ir konkurētspējīgas (piemēram, alus un limonāde), bet preces TI1 un TII3 ir viena otru papildinošas (piemēram, alus un raudas); citi produkti ir neitrāli. Firmas I peļņa ir atkarīga no abu firmu pārdošanai piedāvāto preču kombinācijas, un to nosaka 4. tabula. Ir zināms, ka firma II laiž pārdošanā preci TII3 trīs reizes retāk nekā TII1 un četras reizes retāk nekā TII2. . Kuru produktu vajadzētu pārdot uzņēmumam I?

4. tabula

Vides stāvokļi

Lūk, firmas I lēmums izlikt pārdošanai produktu TI1, uzņēmuma X2 lēmums piedāvāt pārdošanai firmu I produktu TI2.

Aprēķināsim šīs tabulas matemātiskās cerības:

M=8H3/8+18H4/8+40H1/8=17, M=18H3/8+15H4/8+14H1/8=16.

Optimālā stratēģija būs risinājums X1, t.i. Firma I piegādā preces TI1. Protams, 17 naudas vienību izmaksa ir labāka par 16. Taču, izvēloties risinājumu X1, mēs saņemsim nevis 17 naudas vienības, bet vienu no laimestiem: 8, 18 vai 40. Izvēloties risinājumu X2, mēs nesaņemsim 16 naudas vienības, bet viens no laimestiem ir 18, 15 vai 14. Sastādām tabulu, kurā parādītas iespējamo laimestu novirzes no to paredzamajām vērtībām un šo noviržu varbūtība.

5. tabula. Noviržu vērtības

No šīs tabulas var redzēt, ka ar vienādiem paredzamajiem laimestiem novirzes no sagaidāmā laimesta noved atšķirīgi: X1 šīs novirzes ir nozīmīgas, bet X2 tās ir salīdzinoši nelielas.

No analīzes varam secināt: riska apstākļos Baisa-Laplasa kritērijs (paredzamais vidējais ieguvums) nav adekvāts un ir jāmaina, ņemot vērā iespējamās novirzes izlases lielumu no tā vidējās vērtības.

Varbūtību teorijā dispersiju Do jeb standarta novirzi y= parasti izmanto kā nejauša lieluma novirzes no tā vidējās vērtības mērījumu. Lēmumu pieņemšanas problēmās riska apstākļos par riska rādītāju uzskatīsim standarta novirzi y, kopš y ir tāda pati dimensija kā nejaušajam mainīgajam o, matemātiskajai cerībai Mo.

Tādējādi, lai pieņemtu lēmumu riska apstākļos, alternatīva Xi izvēle noved pie gadījuma lieluma oi, ko var raksturot ar rādītāju pāri (Mo, уi). Tagad sāksim konstruēt adekvātu kritēriju alternatīvu salīdzināšanai. Faktiski šeit mēs iegūstam divu kritēriju optimizācijas problēmu, kur daļējie kritēriji ir matemātiskā cerība Mo (šī kritērija vērtība ir jāpalielina) un standarta novirze y (šī kritērija vērtība ir jāsamazina).

Apsvērsim iespēju atrast Pareto-optimālus risinājumus šai daudzkritēriju problēmai. Pieņemsim, ka ir nepieciešams izvēlēties vienu optimālu risinājumu no iespējamo risinājumu kopas, no kuriem katru nosaka indikatoru pāris (Moi, уi). Attēlojot punktus ar koordinātām (Moi, уi) koordinātu plaknē, iegūstam attēlā redzamā tipa attēlu. 1, t.i. mēs saņēmām aplēses vietu. Kreisā puse attēla (sarkani punkti) nozīmes matemātiskās cerības mēs paņēmām pozitīvas un y negatīvas vērtības, jo Mums ir jāsamazina šis kritērijs (y). Pareto optimālie aprēķini ir pareizi augšējā robeža un attiecīgi Pareto optimālie risinājumi X1, X2, X9 un X7.

Šajā piemērā Pareto optimālo risinājumu kopa ir X1, X2, X9, X7 un no šīs kopas tiek veikta galīgā optimālā risinājuma atlase. Kā minēts iepriekš, šeit ir divas pieejas: pirmā pieeja ir tāda, ka tiek izveidots Pareto optimālo risinājumu kopums, un no šīs kopas lēmumu pieņēmējs izvēlas unikālu risinājumu, pamatojoties uz neformāliem papildu apsvērumiem. Apskatīsim otro pieeju, kuras pamatā ir Pareto optimālo alternatīvu kopas sašaurināšanās.

  • 1. Galvenā kritērija izvēle un zemāko robežu piešķiršana citiem kritērijiem. Piešķirsim apakšējo robežu pēc kritērija M un minimizējam kritēriju y. Par kritērija M apakšējo robežu ņemam vērtību M4 (skat. 1. att.), tad optimālais risinājums būs X2, tātad starp nosacījumu Mi? M4, tas ir vismazāk riskants.
  • 2. Leksikogrāfiskā optimizācija ietver kritēriju sakārtošanu pēc svarīguma. Lai, piemēram, M ir vissvarīgākais kritērijs. Tā kā vienīgajam risinājumam X7 ir maksimālā vērtība saskaņā ar kritēriju M, tas ir optimāls. Tas skaidri parāda leksikogrāfiskās optimizācijas metodes trūkumu: viena (svarīgākā) kritērija ņemšana vērā. Šis trūkums ir saistīts ar nepieciešamību ieviest stingru kritēriju prioritāti, un to var novērst, vājinot prioritāšu “stingrību”. Šajā gadījumā tiek izmantota secīgās piekāpšanās metode (mērķa maiņas metode), kas tika apspriesta iepriekš.

Piemēram, mūsu gadījumā, piekāpjoties saskaņā ar kritēriju M, vērtība D, kas norādīta attēlā. 1. Tad izvēles rezultāts pirmajā solī būs alternatīvas X7, X8, X9. Starp tiem labākais pēc otrā kritērija būs X9. Tādējādi, nedaudz pazeminot prasības kritērijam M, mēs būtiski uzlabojām y kritērija novērtējumu (t.i., neliels sagaidāmā ieguvuma samazinājums izraisīja būtisku riska samazināšanos).


Rīsi. 1.

Apskatīsim vispārināta kritērija piemērošanu mūsu problēmai. Kā vispārinātu kritēriju pieņemsim formas funkciju:

f(M, y) = M-lChu, (1)

kur l ir kāda nemainīga vērtība. Faktiski (1) kritērijs ir aditīvs optimizācijas kritērijs daļējiem kritērijiem M, y ar svēruma koeficientiem 1 un - l. Ja n>0, nejaušā lieluma novērtējums, izmantojot aditīvo kritēriju (1), ir mazāks par tā vidējo vērtību, kas ir raksturīga uzmanīgs cilvēks, t.i. riskējošs cilvēks. Gluži pretēji, kad l<0 оценка (1) выше, чем среднее значение, что характеризует человека, склонного к риску. Наконец, при л=0 оценка случайной величины совпадает с её средним значением (т.е. возможные отклонения случайной величины от её среднего значения игнорируются) - это характеризует человека, безразличного к риску.

Piedevas kritērija (1) būtiskā nozīme n>0 ir tāda, ka kritērija f(M, y) pieaugums var notikt gan M palielinājuma, gan y samazināšanās dēļ. Tādējādi personai, kas nevēlas risku, (1) kritērijs atspoguļo vēlmi palielināt sagaidāmo ieguvumu un samazināt novirzes risku no tā. Šajā gadījumā rādītājs l raksturo lēmumu pieņēmēja subjektīvo attieksmi pret risku. Tāpēc l var uzskatīt par subjektīvu riska izvairīšanās mēra rādītāju (subjektīvs piesardzības rādītājs).

Izvēloties ražojamās preces variantu. Uzņēmums var ražot produkciju no šādiem sešiem veidiem: lietussargi (Z), jakas (K), lietusmēteļi (P), somas (S), apavi (T) un (W). Uzņēmuma vadītājam jāizlemj, kuru no šāda veida produkciju ražot gaidāmajā vasaras sezonā. Uzņēmuma peļņa ir atkarīga no tā, kāda būs vasara - lietaina, karsta vai mērena, un to nosaka 6. tabula. Kurš ražošanas variants būs optimāls?

Ja nav papildu informācijas par vides stāvokļiem nenoteiktības apstākļos, to var atrisināt, pieņemot jebkuru hipotēzi par vides uzvedību. Ja lēmuma pieņēmējam ir informācija par lietainas, karstas un mērenas vasaras varbūtību, tad norādītā problēma kļūst par riska lēmuma problēmu. Šajā gadījumā nepieciešamo informāciju var iegūt no statistikas datiem (laika apstākļu novērojumiem noteiktā apgabalā). Pieņemsim, ka lietainas, karstas un mērenas vasaras iespējamība ir attiecīgi 0,2, 0,5 un 0,3. Tad mēs saskaramies ar lēmumu pieņemšanas problēmu riska apstākļos, dots pēc tabulas 7.

6. tabula.

Atradīsim paredzamās izmaksas, kas atbilst risinājumiem Z, K, P, S, T, W. Mums ir:

MZ=0,2H80+0,5H60+0,3H40=58,

Mk=0,2H70+0,5H40+0,3H80=58,

MP=0,2H70+0,5H50+0,3H60=57,

MS=0,2H50+0,5H50+0,3H70=56,

MT=0,2H75+0,5H50+0,3H50=55,

DoZ=196, DoK=336, DoP=61, DoC=84, DoT=100, DoSh=231,5. Standarta novirzes aplūkojamie nejaušie mainīgie ir:

yZ = 14,0, yK = 18,3, yP = 7,8, yS = 9,2, yT = ​​10,0, ySh = 15,2.

Izveidosim katras alternatīvas kritēriju M un y vērtību tabulu (8. tabula)

8. tabula

Kritēriji

Apskatāmos risinājumus attēlosim kā punktus mainīgo M un y koordinātu plaknē un iegūstam att. 2, no kuriem Pareto-optimālie risinājumi ir Z, P, Sh. No šīs kopas jāizdara galīgā optimālās alternatīvas izvēle.

Pareto-optimālās kopas sašaurināšanu (ideālā gadījumā līdz vienam elementam) var veikt tikai tad, ja ir papildu informācija par kritēriju M un y saistību. Kā minēts iepriekš, to var izdarīt ar galvenā kritērija metodi, secīgu koncesiju metodi vai izmantojot leksikogrāfisko kritēriju.

Lēmuma kritēriju pārskatīšana riska apstākļos

Darbu kritērijs

Atlases noteikums šajā gadījumā ir formulēts šādi:

Lēmumu matrica tiek papildināta ar jaunu kolonnu, kurā ir katras rindas visu rezultātu produkti. Tiek atlasītas tās opcijas, kuru rindās ir ietvertas augstākās vērtībasšī kolonna.

Šo kritēriju piemēro šādu apstākļu dēļ:

  • · nav zināmas stāvokļa Bj iestāšanās varbūtības;
  • · jāņem vērā katra stāvokļa Bj izskats atsevišķi;
  • · kritērijs ir attiecināms arī uz nelielu skaitu risinājuma realizāciju;
  • · zināms risks ir pieņemams.

Produkta kritērijs ir pielāgots galvenokārt gadījumiem, kad visi aij ir pozitīvi. Ja tiek pārkāpts pozitivitātes nosacījums, tad jāveic kāda nobīde aij+a ar kādu konstanti a>. Rezultāts, protams, būs atkarīgs no a. Praksē visbiežāk

Ja nevienai konstantei nevar atpazīt nozīmi, tad produkta kritērijs nav piemērojams.

Iepriekšējais Sākums Nākamais

Lēmumu pieņemšana riska apstākļos ar iespēju veikt eksperimentu

Pieņemot lēmumu nenoteiktības (vai riska) apstākļos, fundamentālas risinājuma izvēles grūtības rodas no lēmuma pieņēmēja nezināšanas par patieso vides stāvokli. Iepriekšējās lekcijās tika aplūkoti vairāki kritēriji, no kuriem katrs savā veidā “cīnās” ar nenoteiktību: izvirzot hipotēzi par vides uzvedību (Laplasa, Valda, Hērvica un Sevidža kritērijs); vidēji aprēķinot iegūtos ieguvumus (Bayes-Laplace kritērijs vai paredzamā pieauguma kritērijs); ņemot vērā gan paredzamo ieguvumu, gan novirzes no tā mēru. Tomēr katra no šīm pieejām nodrošina tikai veidu, kā racionāli analizēt nenoteiktību, nenovēršot pašu nenoteiktību. Nenoteiktības novēršanu vai vismaz samazināšanu var veikt, tikai pamatojoties uz patiesā vides stāvokļa noskaidrošanu.

Praksē šāda noskaidrošana parasti tiek veikta, vācot papildu informāciju, kā arī veicot eksperimentus, kuru rezultātus izmanto, lai spriestu par pašreizējo vides stāvokli. Piemēram, pirms ārstēšanas uzsākšanas pacientam ar neskaidru diagnozi ārsts veic papildu pārbaudes; Pirms dārgas naftas urbuma urbšanas ģeologs veic seismisko izpēti; Pirms jebkura produkta ražošanas uzsākšanas uzņēmējs izgatavo šī produkta izmēģinājuma partiju utt. Lēmumu pieņemšanas teorijas ietvaros visas šīs darbības nenozīmē neko vairāk kā eksperimenta veikšanu, lai noskaidrotu vides stāvokli.

Eksperimentu sauc par ideālu, ja, pamatojoties uz tā rezultātiem, lēmumu pieņēmējs atpazīst patieso vides stāvokli. Praksē ideāls eksperiments ir diezgan reti sastopams. Visbiežāk eksperimenta rezultāts sniedz kādu informāciju, uz kuras pamata var noskaidrot vidi.

Kā visefektīvāk izmantot eksperimenta rezultātus un pieejamos statistikas datus, pieņemot lēmumus? Viena no metodēm šīs problēmas risināšanai ir balstīta uz Beijesa formulu – formulu notikumu varbūtību pārvērtēšanai, ņemot vērā eksperimenta rezultātus.

Ņemiet vērā, ka eksperiments nav iespējams katrai lēmumu pieņemšanas problēmai. Ja kādam noteiktam uzdevumam ir iespējams eksperiments, tad rodas uzdevums novērtēt tā īstenošanas iespējamību. Fakts ir tāds, ka eksperimenta veikšana vienmēr prasa izmaksas (materiālu, organizatorisku, laika utt.).

[Rozens] parāda, ka ideāls eksperiments ir izdevīgs tad un tikai tad, ja tā izmaksas ir mazākas par minimālo paredzamo risku:

kur rij ir riski, C ir eksperimenta izmaksas.

Lai iepazīstinātu ar Beijesa pieeju varbūtību pārvērtēšanai, atcerēsimies dažus jēdzienus no varbūtību teorijas.

Notikuma A nosacītā varbūtība, ņemot vērā, ka ir noticis notikums B, tiek apzīmēta ar P(A/B) un tiek aprēķināta pēc formulas

Apskatīsim šādu varbūtību teorētisko shēmu. Pieņemsim, ka B1, B2, …, Bm ir pilna notikumu grupa un katram notikumam Bj, j= ir zināma tā varbūtība P(Bj). Veiksim eksperimentu, kura rezultātā notika notikums A. Ja ir zināmas nosacītās varbūtības P(A/Bj) visiem j=, tad notikuma Bj nosacītā (pēceksperimentālā) varbūtība (j=, ) var atrast, izmantojot Beijesa formulu

Tagad shematiskā veidā aplūkosim lēmumu pieņemšanas problēmu riska apstākļos, kas norādīta, izmantojot izmaksu matricu, kurai ir formas tabula.

1. tabula. Maksājumu matrica ar vides stāvokļa varbūtības vektoru

Vides stāvokļi

Šeit B1, B2, …, Bm ir vides stāvokļi, aij ir spēlētāja peļņa situācijā, kad viņš izvēlas stratēģiju Xi, un vide ieņem stāvokli Bj. Lēmuma pieņēmējs zina stāvokļa Bj iestāšanās varbūtību P(Bj)= qj un P(Bj)?0 un. Tiek pieņemts, ka vide var būt vienā un tikai vienā no stāvokļiem B1, B2, ..., Bm. Citiem vārdiem sakot, nejauši notikumi B1, B2, ..., Bm veido pilnīgu notikumu grupu, tāpēc tos var uzskatīt par hipotēzēm. Lēmuma pieņēmējam zināmās vides stāvokļu varbūtības P(Bj) (j=) ir beznosacījuma (pirmseksperimentālas, a priori) varbūtības.

Pieņemsim, ka tiek veikts kāds eksperiments, kura rezultāts kaut kādā veidā ir atkarīgs no esošā vides stāvokļa. Ja eksperimenta rezultātā tiek novērots notikums A un papildus ir zināmas nosacītās varbūtības P(A/Bj) visiem j=, tad, izmantojot Beijesa formulu, var atrast pēceksperimentālo (posterior) katra vides stāvokļa varbūtības. Zināšanas par vides stāvokļu rafinētajām varbūtībām ļauj precīzāk precizēt lēmumu pieņēmēja stratēģiju.

Aprakstīto pieeju lēmumu pieņemšanai riska apstākļos sauc par Beijesu, jo tā ir balstīta uz Beijesa formulu. Šo pieeju ilustrē tālāk aplūkotais piemērs.

Uzdevums. Eļļas urbuma urbšana.

Meklēšanas grupas vadītājam jāpieņem lēmums: urbt naftas urbumu vai nē. Aka var izrādīties “sausa” (C), t.i. bez eļļas, “mazjaudas” (M), t.i. ar zemu eļļas saturu, un “bagāts” (B), t.i. ar augstu eļļas saturu. Grupas vadītāja alternatīvas ir: x1 - urbt un x2 - neurbt. Tīrā peļņa, izvēloties kādu no alternatīvām, atkarībā no iespējamā urbuma veida tiek parādīta peļņas tabulā (skat. 1. tabulu)

1. tabula. Maksājumu matrica

Nu tipa

Turklāt meklēšanas grupas vadītājs zina, ka noteiktā apgabalā sausas, plānas vai bagātas akas varbūtības ir šādas: P(C)=0,5, P(M)=0,3, P(B)=0,2.

Meklēšanas grupas vadītājs var veikt eksperimentu, lai noskaidrotu augsnes struktūru (vides stāvokli). Šis eksperiments ir seismiskā uzmērīšana, kuras rezultāts būs atbilde – kāda ir augsnes struktūra dotajā apvidū (bet ne atbilde uz jautājumu par akas veidu!). Principā augsnes struktūra var būt atvērta (O) vai slēgta (C). Grupas vadītājam ir šajā jomā doto eksperimentu rezultātu tabula (skat. 2. tabulu).

2. tabula. Eksperimentālo datu tabula

Šajā tabulā parādīts, cik reižu C, M, B tipa akas ir bijušas atklātas un slēgtas struktūras augsnēs (t.i., tā sniedz kopīgu grunts un aku veidu statistiku konkrētai platībai).

Analizēsim iegūtās tabulas eksperimentālos datus. Pieņemsim, ka ir veikti n eksperimenti, kuru rezultāti ir diskrēto gadījuma lielumu X (urbuma tips) un Y (augsnes struktūra) vērtības, kas ņem vērtības C, M, B un O, Attiecīgi Z. Apzīmēsim ar n11 eksperimentu skaitu, kuros X = C un Y=O, pēc n12 eksperimentu skaitu, kuros X=C un Y=Z, pēc n21 apzīmēsim eksperimentu skaitu, kuros X=M un Y=O utt. Mūsu gadījumā n=100, n11=45, n12=5, n21=11. Dalot 2. tabulas vērtības ar 100 (ar veikto eksperimentu skaitu), iegūstam divdimensiju gadījuma lieluma (X, Y) sadalījuma likumu, kas dots tabulas veidā (sk. 3. tabulu).

3. tabula. Statistikas sērijas sadalījums divdimensiju r.v. (X, Y)

No 3. tabulas izriet, ka P(X=C)=P(C)=0,5, P(X=M)=P(M)=0,3, P(X=B)=P(B)=0,2; Р(Y=O)=P(O)=0,6, Р(Y=З)=P(З)=0,4,

Tātad grupas vadītājam ir jāizlemj:

  • · vai veikt eksperimentu (tā izmaksas ir 10 vienības);
  • · ja veikta, tad ko darīt turpmāk atkarībā no eksperimenta rezultātiem.

Tādējādi ir iegūta daudzpakāpju lēmumu pieņemšanas problēma riska apstākļos. Aprakstīsim metodi optimālā risinājuma atrašanai.

Solis 1. Veidosim koku (1. att.), kas norāda visus lēmumu pieņemšanas procesa posmus – lēmumu koku. Koka zari atbilst iespējamām alternatīvām, un virsotnes atbilst jaunām situācijām. Alternatīvas meklēšanas grupas vadītājam ir: b - eksperimenta atteikums, c - eksperimenta veikšana, x1 - urbt, x2 - neurbt. Dabas stāvokļi: akas veida izvēle (C, M, B), kā arī augsnes struktūras izvēle (O, W).

Uzbūvētais koks nosaka grupas vadītāja spēli ar dabu. Šīs spēles pozīcijas ir koka virsotnes, un spēlētāju kustības ir viņu izvēlētie risinājumi. Pozīcijas, kurās grupas vadītājs veic gājienu, ir attēlotas ar taisnstūri; pozīcijas, kurās daba veic gājienu, ir apvilktas.

Spēle turpinās šādi. Sākuma pozīcijā grupas vadītājs veic gājienu. Viņam jāpieņem lēmums – atteikties no eksperimenta (izvēlēties risinājumu b) vai veikt eksperimentu (izvēlēties risinājumu c). Ja viņš atteicās no eksperimenta, tad spēle pāriet uz nākamo pozīciju, kurā grupas līderim jāpieņem lēmums: urbt (izvēlēties alternatīvu x1) vai neurbt (izvēlēties alternatīvu x2). Ja viņš nolemj veikt eksperimentu, tad spēle pāriet uz pozīciju, kurā daba veic gājienu, izvēloties vienu no stāvokļiem O vai Z, kas atbilst iespējamos rezultātus eksperiments utt. Spēle beidzas, kad tā sasniedz galīgo pozīciju (t.i., koka galotni, kurai no tās neizplūst zari)

2. solis. Katram lēmumam, kas ir dabisks gājiens (tas ir, tas nāk no pozīcijas, kas attēlota ar apli), mums jāatrod šīs kustības iespējamība. Lai to izdarītu, mēs rīkojamies šādi. Katrai koka pozīcijai ir viens ceļš, kas savieno šo pozīciju ar sākuma pozīciju. Ja tas ir dabas pozīcijai, ceļš, kas savieno to ar sākotnējo pozīciju, neiet caur pozīciju (E), kas nozīmē eksperimentu, tad stāvokļu P(S), P(M) un P(B) varbūtības. ) ir beznosacījuma (pirmseksperimentāli) un ir no tabulas. 3:

P(S)=50/100, P(M)=30/100, P(B)=20/100.

Ja dabas pozīcijai ceļš, kas to savieno ar sākotnējo stāvokli, iet caur pozīciju (E), tad vides stāvokļu varbūtības kļūst par nosacītām varbūtībām un tiek atrastas pēc formulām (1), izmantojot tabulas datus. . 3:

Pozīcijā (E) pārvietošanās iespējamības, kas noved pie pozīcijām (O) un (W), ir atrodamas 3. tabulā: P(O)=0,6, P(Z)=0,4.


Rīsi. 1.

3. solis. Novērtēsim visas spēles koka pozīcijas, “nolaižoties” no gala pozīcijām uz sākotnējo. Pozīcijas novērtējums ir sagaidāmais laimests šajā amatā. Mēs atrodam galīgo pozīciju aprēķinus no 2. tabulas. Tagad mēs norādām metodi, kā atrast aplēses patvaļīgai spēļu koka pozīcijai, pieņemot, ka aplēses visām pozīcijām pēc tam jau ir atrastas.

Dabas stāvoklim tās novērtējums atspoguļo sagaidāmo ieguvumu (sk. 2. attēlu);

Spēlētāja pozīcijai aprēķins ir maksimālais no visām pozīcijām aiz tās. Motīvs: “savā” pozīcijā spēlētājs var izdarīt jebkuru gājienu, tāpēc viņš izvēlēsies to, kas novedīs pie lielākā iespējamā laimesta (skat. 3. attēlu). Katrā pozīcijā spēlētājs ar domuzīmi atzīmē koka zaru, kas ved uz pozīciju ar maksimālo punktu skaitu.


Pievērsīsimies att. 1. Atklājam, ka sākotnējā pozīcijā sagaidāmā peļņa bez eksperimenta veikšanas (b alternatīva) ir 20 vienības; paredzamā peļņa ar eksperimentu (alternatīva c) ir 28 vienības. Tādējādi piemērots risinājums ir veikt eksperimentu (seismisko izpēti). Tālāk, ja eksperiments parāda, ka augsne ir atvērta, tad urbt nevajadzētu, bet, ja tā ir slēgta, tad jāveic urbšana.

  • 1 — filiāle: =20
  • 2 — filiāle: 0
  • 3 - filiāle:= -30
  • 4 — filiāle: 0
  • 5 - filiāle: =95
  • 6 — filiāle: 0

Kā izriet no uzdevuma nosacījumiem, mēs varam iegūt vērtību 95 vienības ar varbūtību 0,4. Līdz ar to paredzamais laimests būs 0,4*95=38 vienības. Mēs atņemam eksperimenta izmaksas, kas vienādas ar 10 vienībām.

Rezultātā mēs iegūstam 28 vienības.

Lēmumu koki hierarhiski atspoguļo lēmumu pieņemšanas loģisko struktūru un tādējādi atvieglo problēmas izpratni un tās risināšanas procesu. Atšķirībā no lēmumu matricas, šeit var redzēt lēmumu pieņemšanas procesa laika gaitu. Tomēr lēmumu koku kopumā nevar attēlot ar vienkāršu lēmumu matricu; Šādā veidā var attēlot tikai atsevišķus procesa posmus. Sadalījums posmos tiek veikts tā, lai risinājuma izvēle sākas ar noteiktu lēmuma mezglu, no kura izplūst viens vai vairāki atzari, kas atspoguļo risinājuma iespējas. Tam seko notikumu mezgli un beigās - lapas", kas apzīmē gala stāvokļus, norādot atbilstošo izvades parametru vērtības. Ja notikumu mezgliem atkal seko lēmuma mezgls ar atbilstošām darbībām, tad šis un visi nākamie zari attiecas uz vairāk vēlīnā stadija izvēloties risinājumu.. Tādējādi var izsekot visam ceļam no lēmumu koka sākuma līdz beigām.

Lēmumu koks atšķir notikumu mezglus un lēmumu mezglus. Var iedomāties, ka notikumu mezglos tiek noteikta tālākā ceļa izvēle ārējiem apstākļiem(pēc būtības, spēles teorijā – pretinieks), un lēmumu mezglos – lēmumu pieņēmējs.

Lēmumu kokus ir viegli modificēt: nepieciešamības gadījumā tos var attīstīt tālāk, un gadījumos, kad atsevišķi zari praktiski nav jēgas, tos var attiecīgi samazināt. Lēmuma mezglus, ja tie ir saistīti ar vienu darbību un nav atdalīti ar notikumu mezgliem, var apvienot. Tas pats attiecas uz notikumu mezgliem.



Jaunums vietnē

>

Populārākais