Bahay Kalinisan Mga pagtatasa ng eksperto sa pamamaraang minimax at mga pamamaraan ng Bayes-Laplace at Savage. Tingnan ang mga pahina kung saan binanggit ang terminong Bayes criterion

Mga pagtatasa ng eksperto sa pamamaraang minimax at mga pamamaraan ng Bayes-Laplace at Savage. Tingnan ang mga pahina kung saan binanggit ang terminong Bayes criterion

Mag-ehersisyo. Plano ng kumpanya na ibenta ang mga produkto nito sa mga merkado, na isinasaalang-alang ang mga posibleng opsyon para sa demand ng consumer P j , j = 1.4 (mababa, katamtaman, mataas, napakataas). Ang kumpanya ay bumuo ng tatlong mga diskarte para sa pagbebenta ng mga kalakal A 1, A 2, A 3. Ang dami ng turnover (mga yunit ng pera), depende sa diskarte at demand ng consumer, ay ipinakita sa talahanayan.
P 1P 2P 3P 4
A 130+N10 20 25 + N/2
A 250 70 - N10 + N/225
A 325 – N/235 40 60 - N/2
kung saan ang N=3
Ang mga posibleng estado ng demand ng consumer ay kilala, na, ayon sa pagkakabanggit, q 1 =0.3, q 2 =0.2, q 3 =0.4, q 4 =0.1. Ito ay kinakailangan upang makahanap ng isang diskarte sa pagbebenta na nagpapalaki sa average na turnover ng kumpanya. Sa kasong ito, gamitin ang pamantayan ng Wald, Hurwitz, Savage, at Bayes.

Solusyon maghanap gamit ang isang calculator.
Bayes criterion.
Ayon sa Bayes criterion, ang diskarte (puro) A i na nag-maximize average na panalo a o ang average na panganib r ay pinaliit.
Binibilang namin ang mga halaga ng ∑(a ij p j)
∑(a 1,j p j) = 33 0.3 + 10 0.2 + 20 0.4 + 26.5 0.1 = 22.55
∑(a 2,j p j) = 50 0.3 + 67 0.2 + 11.5 0.4 + 25 0.1 = 35.5
∑(a 3,j p j) = 23.5 0.3 + 35 0.2 + 40 0.4 + 58.5 0.1 = 35.9

A iP 1P 2P 3P 4∑(a ij p j)
A 1 9.9 2 8 2.65 22.55
A 2 15 13.4 4.6 2.5 35.5
A 3 7.05 7 16 5.85 35.9
p j 0.3 0.2 0.4 0.1

Laplace criterion.
Kung ang mga probabilidad ng mga estado ng kalikasan ay posible, ang prinsipyo ni Laplace ng hindi sapat na dahilan ay ginagamit upang masuri ang mga ito, ayon sa kung saan ang lahat ng mga estado ng kalikasan ay ipinapalagay na pantay na maaaring mangyari, ibig sabihin.:
q 1 = q 2 = ... = q n = 1/n.
q i = 1/4
A iP 1P 2P 3P 4∑(a ij)
A 1 8.25 2.5 5 6.63 22.38
A 2 12.5 16.75 2.88 6.25 38.38
A 3 5.88 8.75 10 14.63 39.25
p j 0.25 0.25 0.25 0.25
Konklusyon: pumili ng diskarte N=3.
Wald na pamantayan.
Ayon sa pamantayan ng Wald, ang isang purong diskarte ay kinuha bilang pinakamainam, na sa ilalim ng pinakamasamang kondisyon ay ginagarantiyahan ang maximum na pakinabang, i.e.
a = max(min a ij)
Ang Wald criterion ay nakatuon sa mga istatistika sa mga pinaka-hindi kanais-nais na estado ng kalikasan, i.e. ang pamantayang ito ay nagpapahayag ng isang pessimistic na pagtatasa ng sitwasyon.
A iP 1P 2P 3P 4min(a ij)
A 1 33 10 20 26.5 10
A 2 50 67 11.5 25 11.5
A 3 23.5 35 40 58.5 23.5
Konklusyon: pumili ng diskarte N=3.
Savage criterion.
Inirerekomenda ng pinakamababang pamantayan sa panganib ng Savage na pumili pinakamainam na diskarte isa kung saan ang magnitude ng pinakamataas na panganib ay pinaliit sa ilalim ng pinakamasamang kondisyon, i.e. ibinigay:
a = min(max r ij)
Ang pamantayan ng Savage ay nakatuon sa mga istatistika sa mga pinaka-hindi kanais-nais na estado ng kalikasan, i.e. ang pamantayang ito ay nagpapahayag ng isang pessimistic na pagtatasa ng sitwasyon.
Nahanap namin ang risk matrix.
Panganib– isang sukatan ng pagkakaiba sa pagitan ng iba't ibang posibleng resulta ng pagpapatibay ng ilang mga estratehiya. Ang pinakamataas na nakuha sa jth column b j = max(a ij) ay nagpapakilala sa paborableng estado ng kalikasan.
1. Kalkulahin ang 1st column ng risk matrix.
r 11 = 50 - 33 = 17; r 21 = 50 - 50 = 0; r 31 = 50 - 23.5 = 26.5;
2. Kalkulahin ang 2nd column ng risk matrix.
r 12 = 67 - 10 = 57; r 22 = 67 - 67 = 0; r 32 = 67 - 35 = 32;
3. Kalkulahin ang ika-3 column ng risk matrix.
r 13 = 40 - 20 = 20; r 23 = 40 - 11.5 = 28.5; r 33 = 40 - 40 = 0;
4. Kalkulahin ang ika-4 na column ng risk matrix.
r 14 = 58.5 - 26.5 = 32; r 24 = 58.5 - 25 = 33.5; r 34 = 58.5 - 58.5 = 0;
A iP 1P 2P 3P 4
A 1 17 57 20 32
A 2 0 0 28.5 33.5
A 3 26.5 32 0 0

A iP 1P 2P 3P 4max(a ij)
A 1 17 57 20 32 57
A 2 0 0 28.5 33.5 33.5
A 3 26.5 32 0 0 32
Konklusyon: pumili ng diskarte N=3.
Hurwitz criterion.
Ang pamantayan ng Hurwitz ay isang pamantayan ng pesimismo - optimismo. Ang pinakamainam na diskarte ay itinuturing na isa kung saan ang sumusunod na kaugnayan ay humahawak:
max(s i)
kung saan s i = y min(a ij) + (1-y)max(a ij)
Para sa y = 1 makuha namin ang Walde criterion, para sa y = 0 makuha namin ang optimistic criterion (maximax).
Isinasaalang-alang ng pamantayan ng Hurwitz ang posibilidad ng kapwa ang pinakamasama at ang pinakamahusay na pag-uugali ng kalikasan para sa mga tao. Paano ka napili? Paano mas masahol na kahihinatnan ng mga maling desisyon, mas malaki ang pagnanais na iseguro laban sa mga pagkakamali, mas malapit ang y sa 1.
Kinakalkula namin ang s i.
s 1 = 0.5 10+(1-0.5) 33 = 21.5
s 2 = 0.5 11.5+(1-0.5) 67 = 39.25
s 3 = 0.5 23.5+(1-0.5) 58.5 = 41
A iP 1P 2P 3P 4min(a ij)max(a ij)y min(a ij) + (1-y)max(a ij)
A 1 33 10 20 26.5 10 33 21.5
A 2 50 67 11.5 25 11.5 67 39.25
A 3 23.5 35 40 58.5 23.5 58.5 41
Konklusyon: pumili ng diskarte N=3.
Kaya, bilang isang resulta ng desisyon istatistikal na laro Ayon sa iba't ibang pamantayan, ang diskarte A 3 ay inirerekomenda nang mas madalas kaysa sa iba.

Nagpasya ang pamamahala ng kumpanya na hanapin ang produksyon ng isang bagong produkto sa isang tiyak na lokasyon. Upang makabuo ng isang ideya ng sitwasyon sa merkado ng isang bagong produkto sa oras ng pag-master ng produksyon, kinakailangang isaalang-alang ang mga gastos sa paghahatid ng mga natapos na produkto sa mamimili, ang pagbuo ng transportasyon at panlipunang imprastraktura ng rehiyon, kumpetisyon sa merkado, ang relasyon sa pagitan ng supply at demand, mga halaga ng palitan at marami pang iba. Mga posibleng opsyon mga desisyon, ang pagiging kaakit-akit sa pamumuhunan na kung saan ay tinukoy bilang ang porsyento ng paglago ng kita na may kaugnayan sa halaga ng mga pamumuhunan sa kapital, ay ipinakita sa talahanayan.
Pumili:
1) isang lugar upang mahanap ang produksyon, kung ang pinuno ng negosyo ay tiwala na ang sitwasyon 4 ay bubuo sa merkado;
2) isang lugar upang mahanap ang produksyon kung tinatantya ng pamamahala ang posibilidad ng sitwasyon 1 na maging 0.2; mga sitwasyon 2 sa 0.1; sitwasyon 3 sa 0.25;
3) pumili ng opsyon sa ilalim ng mga kondisyon ng kawalan ng katiyakan ayon sa criterion: maximax, maximin, Laplace criterion, Savage criterion, Hurwitz criterion (y = 0.3);
4) magbabago ba ito pinakamahusay na pagpipilian mga solusyon ayon sa pamantayan ng Hurwitz kung ang halaga ng a ay tumaas sa 0.5?
5) sa pag-aakalang ang data ng talahanayan ay kumakatawan sa mga gastos ng negosyo, matukoy ang pagpili na gagawin ng negosyo kapag ginagamit ang bawat isa sa sumusunod na pamantayan: maximin; maxima; Hurwitz criterion(? = 0.3); Savage criterion; Laplace criterion

Ipagpalagay na ang mga deposito ay ipinamamahagi nang pantay-pantay sa buong teritoryo. Ang pamamaraang ito ay halos hindi maituturing na lehitimo, dahil ang mga konklusyon na nakuha sa tulong nito ay walang lohikal na batayan. Gayunpaman, ang Bayes-Laplace criterion ay hindi mas arbitrary kaysa sa Hurwitz criterion.


Ang optimistikong diskarte, mga diskarte batay sa pamantayan ng Hurwitz, ang pamantayan ng Bayes-Laplace at ang pamantayang Savage ay nasa sa kasong ito susunod na view

Bayesian (Laplace) criterion 27, 224 Bayesian approach 27 Balanse 27 Balancing (o equilibrium)

Kabilang sa mga pamantayan at panuntunang ito, ang isang espesyal na lugar ay inookupahan ng mga tuntunin at pamantayan batay sa kilalang Bayes theorem. Ang isang diskarte na nakabatay sa teorama na ito ay nagpapahintulot, una, na gumamit ng ilang metodolohikal na mga prinsipyo ng mga natural na agham sa pamamahala, at pangalawa, upang matiyak na ang mga paghatol at paggawa ng desisyon ay nababagay habang nagkakaroon ng karanasan. Ang huli ay nangangahulugan ng pag-aaral na pamahalaan (sa kahulugan ng paggawa ng mga desisyon) sa proseso ng pamamahala mismo 1.

Minsan sa panahon ng isang operasyon, ang kawalan ng katiyakan ay unti-unting nabubunyag habang nagiging available ang impormasyon. Sa kasong ito, upang bigyang-katwiran ang mga desisyon, maginhawang gamitin ang gayong layunin na pamantayan bilang posterior probability ng isang kaganapan. Ang probabilidad na ito mismo ay pinakamadaling kalkulahin gamit ang formula ng Bayes sa mga tuntunin ng odds. Isaalang-alang natin ang kakanyahan ng diskarteng ito.

Ang Bayes criterion ay ginagamit sa mga kaso kung saan alam ang probability distribution ng mga posibleng state. Kung ang discrete probability distribution na ito ay ibinibigay ng set of probabilities , pagkatapos ay ayon sa Bayes criterion, ang diskarteng Si ay mas mainam kaysa Sj (s > if

Ang mga espesyal na kaso ng criterion na ito ay ang Bayes criterion (para sa A = 1) at ang Wald criterion (para sa A = 0).

Ang Bayes-Laplace criterion, hindi tulad ng Wald criterion, ay isinasaalang-alang ang bawat isa sa mga posibleng kahihinatnan ng lahat ng mga pagpipilian sa pagpapasya

Ang Bayes-Laplace criterion ay nagpapataw ng mga sumusunod na kinakailangan sa sitwasyon kung saan ang isang desisyon ay ginawa:

Kapag z = 1, ang criterion ay binago sa Bayes-Laplace criterion, at kapag z = O ito ay nagiging Wald criterion. Kaya, ang pagpili ng z parameter ay napapailalim sa subjectivity. Bilang karagdagan, ang bilang ng mga pagpapatupad ay nananatiling hindi binabantayan. Samakatuwid, ang pamantayang ito ay bihirang ginagamit kapag gumagawa ng mga teknikal na desisyon.

Sinuri namin ang ilang mga pangunahing diskarte sa paggawa ng desisyon sa kaso ng hindi tiyak na mga kadahilanan sa modelong pinag-aaralan. Maaari kang magbigay ng mga halimbawa kapag ang lahat ng pamantayan sa paggawa ng desisyon ay humahantong sa pagpili ng parehong solusyon x e X, ngunit kadalasan hindi ito nangyayari, ang bawat pamantayan ay humahantong sa sarili nitong desisyon (isang halimbawa ng ganitong uri ay tinalakay sa susunod na kabanata). Samakatuwid, ang mga talakayan ay lumitaw tungkol sa kung aling pamantayan ang mas kanais-nais at kung kailan. ang mga pagtatangka ay ginawa upang bumuo ng isang solong batay sa ilang mga pamantayan. Sa partikular, ang Hurwitz criterion ay isang kumbinasyon ng dalawang pamantayan. Sinubukan ding pagsamahin ang pamantayan ng Hurvtz at ang pamantayan ng Bayes-Laplace. Ang lahat ng resultang pamantayan ay may mataas na antas ng arbitrariness. Sa aming opinyon, ang tanging paraan upang malampasan ang mga paghihirap na ito ay isang multi-criteria approach, kung saan maaaring isaalang-alang ng gumagawa ng desisyon ang mga opsyon para sa paggawa ng desisyon na epektibo mula sa punto ng view ng isang set ng mga indicator, at piliin ang pinakaangkop. isa sa kanila. Ang pamamaraang ito ay ginamit sa halimbawang ibinigay sa susunod na kabanata. Siyempre, ang kabuuan ng mga tagapagpahiwatig ay hindi dapat masyadong malaki.

Karaniwan, maraming mga pagsasaayos ang sinubukan magkaibang numero mga elemento at istraktura ng mga koneksyon. Isa sa pinaka mahahalagang tagapagpahiwatig ay ang dami ng set ng pagsasanay at tinitiyak ang kakayahang mag-generalize sa panahon ng karagdagang trabaho, at ang nais na resulta ay maaaring makamit sa iba't ibang mga scheme. Ang pinakakaraniwang ginagamit na mga pamamaraan ay sequential descent (na may confirmatory set) o N-fold cross-validation. Ang mas makapangyarihang pamantayan ng impormasyon ay maaari ding ilapat (1) pangkalahatang cross-validation (GV), panghuling Akaike prediction error (FPE), Bayes criteria (BI) at Akaike criteria (AI) (tingnan ang ). Upang mapabuti ang mga kakayahan sa generalization at maalis ang panganib ng overfitting, ginagamit din ang pagbabawas ng timbang at pag-aalis (pagnipis ng puno). Kasabay nito, ang arkitektura ng network ay binago, ang ilang mga koneksyon ay tinanggal at ang epekto ng mga ito sa kahusayan ay pinag-aralan. >,

BAYES (LAPLACE) CRITERION - sa decision theory, isang criterion para sa paggawa ng mga desisyon sa kawalan ng anumang impormasyon tungkol sa mga relatibong probabilidad ng mga diskarte ng "kalikasan". (Tingnan ang Uncertain problems.) Ayon kay B.(L.)k. Iminungkahi na magbigay ng pantay na probabilidad sa lahat ng mga diskarte na isinasaalang-alang, at pagkatapos ay tanggapin ang isa na may pinakamalaking inaasahang kabayaran. Ito ay may kawalan na ang hanay ng mga nasuri na alternatibo sa parehong problema ay maaaring magkakaiba at, nang naaayon, ang relatibong posibilidad ng bawat isa sa kanila ay maaari ding magkaiba.

Pamantayan ng Hodges-Lehman. Kapag ipinapatupad ang pamantayang ito, dalawang pansariling tagapagpahiwatig ang ginagamit: una, ang pamamahagi ng posibilidad na ginamit sa pamantayan ng Bayes, at pangalawa, ang "parameter ng optimismo" mula sa pamantayan ng Hurwitz.

Ang pamantayan ng Hodge-Lehman ay nakabatay nang sabay-sabay sa pamantayan ng Wald at Bayes-Laplace

Kapag naghahanap ng pinakamainam na solusyon, kadalasang ginagamit nila iba't ibang pamantayan, na nagbibigay ng ilang pamamaraan sa paggawa ng desisyon. Tingnan natin ang ilan sa kanila.

Bayes criterion. Kapag ginagamit ang Bayes criterion, alam ng statistician ang probabilities q k ng paglitaw ng event P k. Kadalasan, ang probabilities q k ay natutukoy sa pamamagitan ng pagsasagawa ng mga eksperimento. Ang ganitong mga probabilidad ay tinatawag na posterior. Ang purong diskarte ay tinatanggap bilang pinakamainam ayon sa pamantayan ng Bayes A i, kung saan ang average na istatistika ng panalong ay nagiging maximum.

Laplace criterion. Ang Laplace criterion ay naiiba sa Bayes criterion dahil ang posterior probabilities ay hindi alam. Pagkatapos sila ay kinuha pantay at kinakalkula gamit ang formula

Savage criterion. Ang criterion na ito ay criterion ng extreme pesimism, i.e. ang statistician ay nagsisimula sa palagay na ang kalikasan ay kumikilos laban sa kanya sa pinakamasamang posibleng paraan. Inirerekomenda ng Savage criterion ang pagpili bilang pinakamainam na purong diskarte A i kung saan ang pinakamataas na panganib ay minimal. Ang panganib na ito ay tinatawag na minimax at kinakalkula ng formula

Wald na pamantayan. Tulad ng Savage criterion, ang Wald criterion ay isang criterion ng matinding pesimismo. Samakatuwid, ang statistician ay pumipili ng isang purong diskarte A upang ang pinakamaliit na kabayaran ay ang pinakamataas. Ang pakinabang na ito ay tinatawag na maximin at kinakalkula ng formula

Hurwitz criterion. Ang criterion na ito ay isang criterion ng pessimism-optimism at nagrerekomenda ng paggamit ng isang bagay sa pagitan. Sa kasong ito, pipili ang statistician ng isang purong diskarte A i kung saan ang sumusunod na kundisyon ay hawak:

kung saan ang γ=0÷1 ay pinili mula sa mga pansariling pagsasaalang-alang. Kapag γ = 1, ang Hurwitz criterion ay binago sa Wald criterion.

Halimbawa 4.6. Ang isang studio ay ginagawa upang ayusin ang mga TV sa kondisyon ng inpatient. Para sa pagiging simple, ipinapalagay namin na ang daloy ng mga kahilingan para sa pag-aayos ay ipinahayag ng mga numero 2, 4, 6 at 8 libong mga aplikasyon bawat taon. Ito ay kilala mula sa karanasan na ang kita sa pag-aayos ng isang TV ay 9 den. mga yunit Sa taong. Mga pagkalugi na dulot ng pagkabigo sa pagkumpuni dahil sa kakulangan ng kapasidad - 5 den. mga yunit Pagkalugi mula sa downtime ng mga espesyalista at kagamitan sa kawalan ng mga aplikasyon - 6 na araw. mga yunit para sa bawat aplikasyon.



Magbigay ng impormasyon tungkol sa kapasidad ng studio na ginagawa gamit ang ibinigay na pamantayan.

Solusyon. Ang Player A dito ay ang katawan na gumagawa ng mga desisyon tungkol sa kapasidad ng ginawang studio. Ang kanyang dalisay na diskarte ay:

■ A 1 - pagbubukas ng studio na may kapasidad na 2 libong telebisyon bawat taon;

§ A 2 - pagbubukas ng isang studio na may kapasidad na 4 na libong telebisyon bawat taon;

■ Isang 3 - pagbubukas ng isang studio na may kapasidad na 6 na libong telebisyon bawat taon;

■ Isang 4 - pagbubukas ng isang studio na may kapasidad na 8 libong telebisyon bawat taon.

Ang pangalawang manlalaro ay ang kabuuan ng lahat ng mga pangyayari kung saan nabuo ang daloy ng mga kahilingan para sa pag-aayos ng TV sa isang studio, i.e. kalikasan P. Napagtanto ng kalikasan ang alinman sa apat na estado:

P 1- ang daloy ay magiging 2 libong TV bawat taon;

■ P g - ang daloy ay magiging 4 na libong telebisyon bawat taon;

P 3- ang daloy ay magiging 6 na libong TV bawat taon;

§ P 4- ang daloy ay magiging 8 libong TV bawat taon.

Kalkulahin natin ang mga kabayaran a ik ng manlalaro A sa ilalim ng anumang kumbinasyon ng mga pangyayari ( A i , P k). Ang pinaka-kanais-nais na mga sitwasyon ay kapag ang bilang ng mga aplikasyon na natanggap ay tumutugma sa mga kakayahan ng studio.

Para sa kumbinasyon ( A 1, P 1) ang tubo ay magiging isang 11 = 2 * 9 = 18 thousand. mga yunit, para sa kumbinasyon ( A 2, P 2) mayroon kaming 22 = 4 * 9 = 36 thousand den. mga yunit atbp.

Para sa kaso ( A 1, P 2) sa studio maaari kang mag-ayos ng 2 libong telebisyon, at 4 na libong mga aplikasyon ang natanggap. Ang mga pagkalugi sa kasong ito ay magiging 2 * 5 = 10 libo. mga yunit, at kabuuang tubo a n =2*9-2*5=8 thousand den. mga yunit

Para sa kaso ( A i , P k) sa studio maaari kang mag-ayos ng 4 na libong telebisyon, at 2 libong mga aplikasyon ang natanggap. Ang mga pagkalugi sa kasong ito ay magiging 2 * 6 = 12 libo. yunit, at kabuuang tubo a 21 = 18-12 = 6 thousand den. mga yunit Ang iba pang mga elemento ng matrix ng pagbabayad ay matatagpuan sa parehong paraan. Ang mga resulta ng pagkalkula ay ipinakita sa talahanayan. 4.13.

Mula sa mesa 4.13 ito ay sumusunod na ang mas mababang netong presyo ng laro

at ang itaas na netong presyo ng laro

Dahil α ≠ β, ang laro ay hindi naglalaman ng saddle point. Ang statistician ay walang dominanteng estratehiya.____________

Bayes criterion. Hayaang malaman ang mga probabilidad q k ng estado ng kalikasan P k.Sa Talahanayan. 4.13 ang mga probabilidad na ito ay itinalaga bilang . Gamit ang formula (4.23) nahanap namin ang mga halaga ng average na panalo. Ang mga halagang ito ay ibinibigay sa ikapitong hanay ng talahanayan. 4.13. Bilang pinakamainam ayon sa pamantayan ng Bayes, ang purong diskarte A 3 (magbukas ng workshop para sa 6 na libong pag-aayos bawat taon) ay tinatanggap, kung saan ang average na pakinabang ay mga istatistika .

Talahanayan 4.13

P 1(2) P 2(4) P 3(6) P 4(8) α i 0.8α i δi 0.2δi h i
A 1 (2) -2 -12 -12 3,5 -9,6 3,6 -6
A 2 (4) 23,5 4,8 7,2
A 3 (6) -6 -6 29,5 -4,8 10,8
A 4 (8) -18 -18 25,5 -14,4 14,4
β i
0,2 0,35 0,25 0,2
0,25 0,25 0,25 0,25

Ang mga sumusunod na notasyon ay ginagamit dito:

Laplace criterion. Ayon sa pamantayang ito, ang mga probabilidad ay ipinapalagay na pantay at kinakalkula gamit ang formula

Ang purong diskarte A 3 ay tinatanggap din bilang pinakamainam ayon sa pamantayan ng Laplace, kung saan ang average na mga istatistika ng kabayaran

Savage criterion. Upang pag-aralan ang laro gamit ang paraang ito, gagawa kami ng isang risk matrix. Ang mga formula (4.21), (4.22) ay ginagamit para sa mga kalkulasyon. Ang mga resulta ng pagkalkula ay ipinakita sa talahanayan. 4.14.

Tulad ng sumusunod mula sa talahanayan. 4.14, ang minimum ng lahat ng pinakamataas na panganib ay katumbas ng . Ang panganib na ito ay tumutugma sa purong diskarte A 3 (magbukas ng workshop para sa 6 na libong pag-aayos bawat taon).

Talahanayan 4.14

P 1 P 2 P 3 P 4 max rik
A 1
A 2
A 3
A 4

Wald na pamantayan. Mula sa mesa 4.13 ito ay malinaw na ang mas mababang netong presyo ng laro . Ang presyo na ito ay tumutugma sa purong diskarte ng A g (magbukas ng studio para sa 4 na libong pag-aayos bawat taon).

Hurwitz criterion. Ilagay natin ang γ = 0.8. Kinakalkula namin gamit ang formula δi= max a ik (tingnan ang column 10 ng Table 4.13). Pagkatapos, gamit ang data sa column 6 at 10 ng table. 4.13, isinasagawa namin ang pagkalkula gamit ang formula.

Ang resulta ay ipinakita sa hanay 12 ng talahanayan. 4.13. Kahulugan at akma sa diskarte A 2(magbukas ng studio para sa 4 na libong pag-aayos bawat taon).

Laplace criterion

Sa ilang mga kaso, ang sumusunod na pangangatwiran ay tila makatwiran: dahil ang mga hinaharap na estado ng kalikasan ay hindi alam, maaari silang ituring na pantay na posibilidad. Ang diskarte sa solusyon na ito ay ginagamit sa pamantayan ng "hindi sapat na dahilan" ng Laplace.

Upang malutas ang problema, para sa bawat solusyon ang matematikal na inaasahan ng pakinabang ay kinakalkula (ang mga probabilidad ng mga estado ng kalikasan ay ipinapalagay na katumbas ng qj = 1/n, j = 1:n), at ang solusyon ay pinili kung saan ang ang halaga ng pakinabang na ito ay pinakamataas.

Ang hypothesis tungkol sa equiprobability ng mga estado ng kalikasan ay medyo artipisyal, kaya ang prinsipyo ni Laplace ay magagamit lamang sa mga limitadong kaso. Sa mas maraming pangkalahatang kaso dapat ipagpalagay na ang mga estado ng kalikasan ay hindi pantay na posibilidad at gamitin ang Bayes-Laplace criterion upang malutas.

Bayes-Laplace criterion

Ang criterion na ito ay umaalis sa mga kondisyon ng kumpletong kawalan ng katiyakan - ipinapalagay nito na ang mga posibleng estado ng kalikasan ay maaaring italaga ng isang tiyak na posibilidad ng kanilang paglitaw at, nang matukoy ang matematikal na inaasahan ng pakinabang para sa bawat desisyon, piliin ang isa na nagbibigay ng pinakamalaking halaga ng pakinabang:

Ipinagpapalagay ng pamamaraang ito ang posibilidad ng paggamit ng anumang paunang impormasyon tungkol sa mga estado ng kalikasan. Ipinapalagay nito ang parehong pagkauulit ng mga estado ng kalikasan at ang pag-uulit ng mga desisyon, at, higit sa lahat, ang pagkakaroon ng sapat na maaasahang data tungkol sa mga nakaraang estado ng kalikasan. Iyon ay, batay sa mga nakaraang obserbasyon, hulaan ang hinaharap na estado ng kalikasan (prinsipyo ng istatistika).

Pagbabalik sa ating talahanayan 1, ipagpalagay natin na q1=0.4, q2=0.2 at q3=0.4. Pagkatapos, ayon sa pamantayan ng Bayes-Laplace, dinadagdagan namin ang Talahanayan 1 ng isang hanay ng mga inaasahan sa matematika at piliin ang maximum sa mga halagang ito. Nakuha namin ang table 13.

Talahanayan 13.

Ang pinakamainam na solusyon ay X1.

Ang Bayes-Laplace criterion ay nagpapataw ng mga sumusunod na kinakailangan sa sitwasyon kung saan ang isang desisyon ay ginawa:

  • v ang mga posibilidad ng paglitaw ng mga estadong Bj ay kilala at hindi nakadepende sa oras;
  • v ang solusyon ay ipinatupad (theoretically) walang hanggan maraming beses;
  • v para sa isang maliit na bilang ng mga pagpapatupad ng solusyon, ang ilang panganib ay katanggap-tanggap.

Sa isang sapat na malaking bilang ng mga pagpapatupad, ang average na halaga ay unti-unting nagpapatatag. Samakatuwid, sa ganap na (walang katapusan) na pagpapatupad, ang anumang panganib ay inalis.

Ang paunang posisyon ng gumagamit - ang pamantayan ay mas optimistiko kaysa sa kaso ng pamantayang Wald, gayunpaman, ipinapalagay nito ang higit pa mataas na lebel kamalayan at sapat na mahabang pagpapatupad.

Ang nakalistang pamantayan ay hindi nauubos ang iba't ibang pamantayan para sa pagpili ng isang solusyon sa ilalim ng mga kondisyon ng kawalan ng katiyakan, sa partikular, ang mga pamantayan para sa pagpili ng pinakamahusay na pinaghalong mga diskarte, gayunpaman, ito ay sapat na para sa problema sa pagpili ng isang solusyon upang maging hindi maliwanag:

Talahanayan 14. Pinakamainam na mga opsyon na nakuha gamit ang iba't ibang pamantayan

Mula sa Talahanayan 14, malinaw na ang pagpili ng pinakamainam na solusyon ay nakasalalay sa napiling pamantayan (at, sa huli, sa mga pagpapalagay).

Ang pagpili ng criterion (pati na rin ang pagpili ng prinsipyo ng optimality) ay ang pinakamahirap at mahalagang gawain sa teorya ng paggawa ng desisyon. Gayunpaman, ang isang tiyak na sitwasyon ay hindi napakatitiyak na imposibleng makakuha ng hindi bababa sa bahagyang impormasyon tungkol sa pamamahagi ng posibilidad ng mga estado ng kalikasan. Sa kasong ito, pagkatapos matantya ang probabilidad na pamamahagi ng mga estado ng kalikasan, ang pamamaraang Bayes-Laplace ay ginagamit, o ang isang eksperimento ay isinasagawa upang linawin ang pag-uugali ng kalikasan.

Dahil ang iba't ibang pamantayan ay nauugnay sa iba't ibang mga kondisyon kung saan ang isang desisyon ay ginawa, ang pinakamahusay na paraan upang ihambing ang mga rekomendasyon ng ilang mga pamantayan ay upang makakuha ng karagdagang impormasyon tungkol sa sitwasyon mismo. Sa partikular, kung ang desisyon na ginawa ay may kinalaman sa daan-daang mga makina na may parehong mga parameter, pagkatapos ay inirerekomenda na gamitin ang Bayes-Laplace criterion. Kung ang bilang ng mga makina ay hindi malaki, mas mahusay na gamitin ang pamantayan ng minimax o Savage.

Mga halimbawa ng mga pormulasyon sa paglutas ng problema

Sa seksyong ito, gamit ang halimbawa ng paglutas ng mga problema, dapat nating matutunan upang matukoy ang vector ng mga estratehiya, ang vector ng mga estado at ang payment matrix at maglapat ng iba't ibang pamantayan upang makuha ang pinakamainam na solusyon.

Gawain. Napagpasyahan na magbukas ng yacht club sa baybaying bayan. Ilang yate ang dapat bilhin (batay sa: isang yate para sa 5 tao), kung ang tinantyang bilang ng mga miyembro ng club ay mula 10 hanggang 25 tao. Ang taunang subscription ay nagkakahalaga ng 100 unit ng pera. Ang presyo ng yate ay 170 monetary units. Ang pag-upa ng mga lugar at pag-iimbak ng mga yate ay nagkakahalaga ng 730 mga yunit ng pananalapi bawat taon.

Solusyon. Walang alinlangan, makatuwirang isaalang-alang ang bilang ng mga yate na bibilhin sa hanay mula dalawa hanggang lima (4 na opsyon) at ang bilang ng mga potensyal na yate mula 10 hanggang 25. Upang bawasan ang dami ng enumeration, lilimitahan natin ang ating sarili sa mga opsyon 10 , 15, 20, 25 (kung ang mga konklusyon na nakuha para sa mga kaugnay na opsyon ay makabuluhang nag-iiba, magsasagawa kami ng karagdagang, paglilinaw ng pagkalkula). Kaya: X= (Xi) = (2, 3, 4, 5) - bilang ng mga yate (i=1,2,3,4); B = (Bj) =(10, 15, 20, 25) - bilang ng mga miyembro ng yacht club (j=1,2,3,4).

Upang magsimulang maghanap ng solusyon, gagawa kami ng decision matrix, ang mga elemento nito ay nagpapakita ng tubo kapag gumagawa ng i-th na desisyon na may j-th na bilang ng mga miyembro ng yacht club:

aij = 100min(5Xi ; Bj) - 170Xi - 730

mga. mapagpasyang tuntunin sa ating problema ito ay binabalangkas bilang "kita - gastos".

Pagkatapos magsagawa ng mga simpleng kalkulasyon, punan natin ang decision matrix (aij) (tingnan ang Talahanayan 15):

solusyon sa teorya ng laro matrix

Talahanayan 15. Payment matrix

Halimbawa, a11 = 100min(52, 10) - 1702-730 =-70

a12=100min(52, 15)-1702-730=-70

a13 = a14 = -70 (ang pangangailangan para sa mga yate ay mananatiling hindi nasisiyahan). Ang mga negatibong halaga ay nagpapakita na sa mga ratio na ito ng demand para sa mga yate at ang kanilang kakayahang magamit, ang yate club ay nagkakaroon ng mga pagkalugi.

Wald criterion (pagpipilian ng isang maingat, pesimistikong diskarte) - para sa bawat alternatibo (bilang ng mga yate sa club) ang pinakamasamang sitwasyon ay pinili ( pinakamaliit na halaga halaga ng kita) at kasama ng mga ito ang garantisadong maximum na epekto ay matatagpuan:

ZMM=max(-70; -240; -410; -580)=-70

Konklusyon: kapag gumagawa ng desisyon gamit ang Wald criterion, ang yacht club ay dapat bumili ng 2 yate at ang maximum na inaasahang pagkawala ay hindi lalampas sa CU 70.

Hurwitz criterion (isang kompromiso na solusyon sa pagitan ng pinakamasamang kinalabasan at isang sobrang optimistiko). Isaalang-alang natin ang pagbabago sa solusyon sa ating problema depende sa mga halaga ng optimism coefficient (sa Talahanayan 16 ang mga halaga na nakakatugon sa pamantayan ng Hurwitz ay naka-highlight para sa iba't ibang):

Talahanayan 16. Mga solusyon sa Hurwitz para sa iba't ibang

Konklusyon: sa 0.5 dapat kang bumili ng 5 yate at asahan ang isang kita na halos 170 rubles. (umaasa kami para sa malawak na katanyagan ng aming club at isang tiyak na kakayahang mabuhay sa pananalapi ng mga amateur), sa = 0.2 hindi kami dapat bumili ng higit sa 2 yate (mas maingat kami sa aming mga pagtataya at, malamang, mas gugustuhin na tumanggi na lumikha ng isang club).

Savage criterion (paghahanap ng pinakamababang panganib). Kapag pumipili ng solusyon batay sa pamantayang ito, ang utility matrix ay una kumpara sa regret matrix D - para sa aming halimbawa, sa pamamagitan ng pagbabawas (-70) mula sa unang hanay ng utility matrix, 260 mula sa pangalawang hanay, 590 at 920 mula sa ikatlo at ikaapat na hanay, ayon sa pagkakabanggit, nakuha namin ang risk matrix (tingnan ang talahanayan 17):

Talahanayan 17. Risk matrix

Ang pinakamaliit na halaga sa mga maximum na elemento ng hilera (mga naka-highlight na halaga sa talahanayan) ay katumbas ng:

ZS=min(990; 660; 340; 510)=340

Konklusyon: sa pamamagitan ng pagbili ng 4 na yate para sa yate club na aming bubuksan, kami ay tiwala na sa pinakamasamang kaso, ang mga pagkalugi ng club ay hindi lalampas sa CU 340.

Pamantayan ng desisyon ng Bayes-Laplace. Ipagpalagay natin na may mga istatistikal na data na nagpapahintulot sa amin na tantyahin ang posibilidad ng isang partikular na pangangailangan para sa pagiging miyembro sa isang yacht club: q=(0.1; 0.2; 0.4; 0.3). Pagkatapos ay ang matematikal na inaasahan ng halaga ng kita para sa bawat isa sa mga isinasaalang-alang na opsyon sa solusyon (supply ng mga yate sa yacht club):

a1r = (-700.1)+(-700.2)+(-700.4)+(-700.3) =-70 ,

a2r= (-2400.1)+(2600.2)+(2600.4)+(2600.3) =210;

a3r = 390; a4r = 370.

Konklusyon: sa mga kondisyon ng sitwasyon na isinasaalang-alang, pinaka-marapat na bumili ng 4 na yate (sa kasong ito, ang maximum na inaasahang kita ng yacht club ay 390 na mga yunit ng pananalapi).

Upang ilapat ang Laplace criterion makikita namin:

a1r = ((-70)+(-70)+(-70)+(-70)) / 4 = -70 ;

a2r = ((-240)+(260)+(260)+(260)) / 4 =135;

a3r = 215; a4r = 170.

Konklusyon: sa ilalim ng mga kondisyon ng pantay na posibilidad ng paglitaw ng isa o isa pang demand para sa pagiging kasapi sa isang yacht club, dapat kang bumili ng 4 na yate at sa parehong oras maaari kang umasa sa isang tubo ng CU 215.

Pangkalahatang konklusyon. Ang itinuturing na pamantayan ay humahantong sa iba't ibang desisyon at sa gayon ay nagbibigay ng pagkain para sa pag-iisip ( desisyon dito ay makabuluhang nakasalalay sa sikolohiya at intuwisyon ng paksa ng desisyon). Ito ay hindi nakakagulat, dahil ang mga pamantayan ay batay sa iba't ibang mga hypotheses. Sa pamamagitan ng pagpapakilala ng isa o ibang hypothesis tungkol sa pag-uugali ng kapaligiran, sa gayon ay "tinatanggal natin ang kawalan ng katiyakan," ngunit ang hypothesis mismo ay isang palagay lamang, hindi kaalaman. Magiging kakaiba kung ang magkakaibang mga pagpapalagay ay palaging humantong sa parehong resulta.

Paggawa ng desisyon sa ilalim ng panganib

Tulad ng nabanggit sa itaas, ang paggawa ng desisyon sa ilalim ng mga kondisyon ng peligro ay nailalarawan sa pamamagitan ng katotohanan na ang pag-uugali ng kalikasan (kapaligiran) ay random. Ito ay ipinahayag sa katotohanan na mayroong isang tiyak na sukatan ng posibilidad alinsunod sa kung saan lumitaw ang ilang mga estado ng kalikasan (nagaganap). Kasabay nito ang mukha Ang ibinigay na solusyon ay may ilang partikular na impormasyon tungkol sa mga posibilidad ng paglitaw ng mga estado ng kapaligiran, na maaaring maging lubhang magkakaibang sa kalikasan. Halimbawa, mayroong tatlong estadong pangkapaligiran na B1, B2 at B3, kung gayon ang karagdagang impormasyon tungkol sa paglitaw ng mga estadong ito ay maaaring ang estadong B1 ay ang pinakamaliit na posibilidad at ang estadong B3 ay mas malamang.

Dahil dito, ang paggawa ng desisyon sa ilalim ng mga kondisyon ng peligro ay ipinapalagay, bilang karagdagan sa pagtukoy sa pagpapaandar ng pagpapatupad, pagtukoy ng ilang karagdagang impormasyon tungkol sa mga posibilidad ng kalagayan ng kapaligiran. Kung ang hanay ng mga estado ng kalikasan B ay may hangganan (ang bilang ng mga estado ay katumbas ng m), kung gayon ang sukatan ng posibilidad dito ay maaaring tukuyin ng probability vector q=(q1, q2, …, qm), kung saan qj?0 at.

Kaya, ang payoff matrix sa ilalim ng mga kondisyon ng peligro ay maaaring ipakita bilang mga sumusunod (tingnan ang Talahanayan 1)

Mga estado sa kapaligiran

Kapag pumipili ng solusyon Xi, alam ng manlalaro na makakatanggap siya ng isa sa mga kabayaran a11, ..., a1m na may probabilities q1, ..., qm, ayon sa pagkakabanggit. Dahil dito, ang kinalabasan para sa gumagawa ng desisyon kapag pumipili ng solusyon Xi ay isang random na variable

Kaya, ang paghahambing ng dalawang solusyon na X1 at X2 ay bumababa sa paghahambing ng kanilang kaukulang mga random na variable.

Ang pagpili ng pinakamainam na solusyon ay karaniwang batay sa isa sa mga sumusunod na pamantayan:

  • 1) Bayes-Laplace criterion - inaasahang halaga (kita o gastos);
  • 2) mga kumbinasyon ng inaasahang halaga at pagkakaiba;
  • 3) pamantayan ng produkto;
  • 4) ang pinaka-malamang na kaganapan sa hinaharap at iba pa.

Tingnan natin ang criterion ng Bayes-Laplace.

Pagsusuri sa inaasahang halaga (Bayes-Laplace test)

Sa huling panayam, tiningnan namin ang pamantayan ng Bayes-Laplace. Ang paggamit ng pamantayang ito (isa pang pangalan ay matatagpuan sa panitikan - ang "inaasahang average na halaga" na pamantayan) ay dahil sa pagnanais na i-maximize ang inaasahang kita (o mabawasan ang inaasahang gastos). Ang paggamit ng mga inaasahang halaga ay nagpapahiwatig ng posibilidad ng paulit-ulit na paglutas ng parehong problema hanggang sa makuha ang sapat na tumpak na mga halaga. mga formula ng pagkalkula. Sa matematika, ganito ang hitsura: hayaan ang o maging isang random na variable na may inaasahan sa matematika na Mo at pagkakaiba-iba ng Do. Kung ang x1, x2,..., xn ay mga halaga random variable(s.v.) oh, ang arithmetic mean ng kanilang (sample mean) na mga halaga

may pagkakaiba-iba. Kaya, kapag n>

Sa madaling salita, na may sapat na malaking sample size, ang pagkakaiba sa pagitan ng arithmetic mean at ang mathematical expectation ay nagiging zero (ang tinatawag na limit theorem of probability theory). Dahil dito, ang paggamit ng pamantayang "inaasahang halaga" ay wasto lamang sa kaso kung kailan ang parehong solusyon ay kailangang ilapat nang sapat na maraming beses. Ang kabaligtaran ay totoo rin: ang pagtutuon sa mga inaasahan ay hahantong sa mga maling resulta para sa mga pagpapasya na kailangang gawin nang ilang beses.

Bago lumipat sa pagbabago sa pamantayan ng Bayes-Laplace, isaalang-alang natin ang pamantayang ito nang mas detalyado.

Nabatid na ang natural na katangiang numerical ng isang random na variable o ay ang mathematical expectation nito na Mo, kung saan ang average na halaga ng random variable na ito ay lumalapit sa isang malaking bilang ng mga pagsubok.

Kung ang isang tao na sumasalungat sa kalikasan ay may istatistikal na data tungkol sa mga pattern sa mga tiyak na pagpapakita ng kalikasan, kung gayon ang problema ay madaling malutas gamit ang mga probabilistikong pamamaraan.

Kaya, kung ang mga probabilidad ng mga estado ng kalikasan ay kilala at hindi nagbabago sa paglipas ng panahon (nakatigil), kung gayon ang solusyon na nagpapalaki sa inaasahang pakinabang (na nagbibigay ng pinakamalaking pag-asa sa matematika ng pakinabang laban sa isang kilalang diskarte ng kalikasan - estado o kondisyon) ay dapat maituturing na pinakamainam.

Halimbawa. Binili ng kumpanya ang makina para sa 100 mga yunit ng pananalapi. Upang ayusin ito, maaari kang bumili ng mga espesyal na kagamitan para sa 50 mga yunit. o gawin sa mga lumang kagamitan. Kung nabigo ang isang makina, ang pag-aayos nito sa tulong ng mga espesyal na kagamitan ay nagkakahalaga ng 10 mga yunit, nang walang mga espesyal na kagamitan - 40 mga yunit. Ito ay kilala na sa panahon ng buhay ng serbisyo nito ang isang makina ay nabigo nang hindi hihigit sa tatlong beses: ang posibilidad na ang makina ay hindi masira ay 0.3; break 1 oras - 0.4; break 2 beses - 0.2; break 3 beses - 0.1. Ito ay kinakailangan upang matukoy ang pagiging posible ng pagbili ng mga dalubhasang kagamitan sa pagkumpuni.

Formalisasyon. Ang unang manlalaro ay may dalawang purong diskarte: bumili (X1) at hindi bumili ng (X2) espesyal na kagamitan sa pag-aayos. Ang Kalikasan, ang pangalawang manlalaro, ay may apat na estado: ang makina ay hindi mabibigo, mabibigo nang isang beses, masisira ng dalawang beses, at masisira ng tatlong beses. Ang payoff function ay ang mga gastos ng kumpanya para sa pagbili at pagkumpuni ng isang makina, na tinukoy ng payment matrix (tingnan ang Talahanayan 1):

Talahanayan 1.

Pagkasira ng makina

B1, hindi kailanman

X1, huwag bumili

X2, bumili

Solusyon. Isaalang-alang muna natin ang problemang ito bilang isang antagonistic na laro. Gamit ang minimax method, makikita natin ang saddle point sa matrix: (X2, B4), kaya, ang presyo ng laro ay v= - 180 monetary units (tingnan ang Table 2).

Talahanayan 2.

Pagkasira ng makina

B1, hindi kailanman

X1, huwag bumili

X2, bumili

Sagot: kailangan mong bumili ng espesyal na kagamitan.

Gayunpaman, sa mga laro na may kalikasan, ang sitwasyon ay radikal na nagbabago: ang kondisyon ay naglalaman na ng matatag na pinaghalong diskarte ng kalikasan: q = (0.3; 0.4; 0.2; 0.1) at alam natin na ang diskarteng ito ang sinusunod ng kalikasan.

Kung ang isang tao - ang unang manlalaro - ay patuloy na maglaro nang mahusay, kung gayon ang kanyang kabayaran ay magiging M=-150Х0.3-160Ч0.4-170Ч0.2-180Ч0.1=-161, at kung gagamitin niya ang una, hindi pinakamainam diskarte, kung gayon ang kanyang inaasahan sa matematika ang mga panalo ay magiging M=-100Х0.3 - 140Х0.4 - 180Х0.2 -220Х0.1 =-144.

Kaya, ito ay kumikita para sa unang manlalaro na maglaro nang suboptimal!

Talahanayan 3.

Pagkasira ng makina

B1, hindi kailanman

X1, huwag bumili

X2, bumili

Sagot: huwag bumili ng espesyal na kagamitan.

Ang makabuluhang pagkakaiba sa pagitan ng mga halaga ng v(x*) at v(x") ay ipinaliwanag sa pamamagitan ng katotohanan na ang pinaghalong diskarte ng kalikasan ay hindi optimal at, sa pamamagitan ng "paglihis" mula sa pinakamainam na diskarte nito, ito ay "nawawala" 36 mga yunit ng pananalapi ng mga panalo.

Kaya, sa isang laro na may kalikasan, ang oryentasyon patungo sa mathematical na inaasahan ng panalo ay talagang isang oryentasyon patungo sa average na panalo, na makukuha kapag ang larong ito ay inulit ng maraming beses (ipagpalagay na ang mga kondisyon ng laro ay hindi nagbabago). Siyempre, kung ang laro ay talagang paulit-ulit nang maraming beses, kung gayon ang pamantayan ng average na kita (halimbawa, sa mga problema sa ekonomiya - average na kita) ay maaaring ituring na makatwiran. Gayunpaman, makatwirang tumuon sa pamantayang ito sa isang pagsubok?

Isaalang-alang ang sumusunod na halimbawa. Ang firm na I ay maaaring magbenta ng isa sa mga kalakal na TI1 o TI2, at ang firm II ay maaaring mag-alok ng isa sa mga kalakal na TII1, TII2, TII3. Ang mga kalakal na TI1 at TII1 ay mapagkumpitensya (halimbawa, beer at limonada), at ang mga kalakal na TI1 at TII3 ay komplementaryo (halimbawa, beer at roach); ibang mga produkto ay neutral. Ang kita ng firm I ay nakasalalay sa kumbinasyon ng mga kalakal na inaalok para sa pagbebenta ng parehong mga kumpanya, at tinutukoy ng talahanayan 4. Alam na ang firm II ay naglalagay para sa pagbebenta ng produkto na TII3 nang tatlong beses na mas madalas kaysa sa TII1 at apat na beses na mas madalas kaysa sa TII2 . Aling produkto ang dapat ibenta sa firm I?

Talahanayan 4

Mga estado sa kapaligiran

Narito ang desisyon na ibenta ng firm I ang produktong TI1, ang desisyon ng X2 na ibenta ng firm I ang produktong TI2.

Kalkulahin natin ang mga inaasahan sa matematika para sa talahanayang ito:

M=8H3/8+18H4/8+40H1/8=17, M=18H3/8+15H4/8+14H1/8=16.

Ang pinakamainam na diskarte ay ang solusyon X1, i.e. Ang firm I ay nagsu-supply ng mga kalakal sa TI1. Siyempre, ang kabayaran ng 17 mga yunit ng pananalapi ay mas mahusay kaysa sa 16. Gayunpaman, kapag pumipili ng solusyon X1, hindi kami makakatanggap ng 17 mga yunit ng pananalapi, ngunit isa sa mga panalo: 8, 18 o 40. Kapag pumipili ng solusyon X2, hindi kami makakatanggap ng 16 na yunit ng pananalapi, ngunit ang isa sa mga panalo ay 18, 15 o 14. Bumuo tayo ng isang talahanayan na nagpapakita ng mga paglihis ng mga posibleng panalo mula sa kanilang inaasahang halaga at ang posibilidad ng mga paglihis na ito.

Talahanayan 5. Mga halaga ng paglihis

Mula sa talahanayang ito makikita na sa pantay na inaasahang panalo, ang mga paglihis mula sa inaasahang mga panalo ay humahantong nang iba: para sa X1 ang mga paglihis na ito ay makabuluhan, at para sa X2 sila ay medyo maliit.

Mula sa pagsusuri maaari nating tapusin: sa mga kondisyon ng peligro, ang Bayes-Laplace criterion (inaasahang average na pakinabang) ay hindi sapat at dapat baguhin nang isinasaalang-alang posibleng mga paglihis random variable mula sa average na halaga nito.

Sa probability theory, ang variance Do o standard deviation y= ay karaniwang ginagamit bilang sukatan ng deviation ng random variable mula sa mean value nito. Sa mga problema sa paggawa ng desisyon sa ilalim ng mga kondisyon ng peligro, isasaalang-alang namin ang karaniwang paglihis y bilang isang tagapagpahiwatig ng panganib, dahil y ay may parehong dimensyon bilang random variable o, ang matematikal na inaasahan Mo.

Kaya, upang makagawa ng desisyon sa ilalim ng mga kondisyon ng peligro, ang pagpili ng alternatibong Xi ay humahantong sa isang random na variable oi, na maaaring mailalarawan ng isang pares ng mga tagapagpahiwatig (Mo, уi). Ngayon simulan natin ang pagbuo ng isang sapat na pamantayan para sa paghahambing ng mga alternatibo. Sa katunayan, dito nakakakuha tayo ng dalawang-kriterya na problema sa pag-optimize, kung saan ang bahagyang pamantayan ay ang matematikal na inaasahan Mo (ang halaga ng pamantayang ito ay kailangang i-maximize) at ang karaniwang paglihis y (ang halaga ng pamantayang ito ay kailangang mabawasan).

Isaalang-alang natin ang paghahanap ng mga Pareto-optimal na solusyon para sa multicriteria na problemang ito. Ipagpalagay natin na kinakailangang pumili ng isang pinakamainam na solusyon mula sa isang hanay ng mga magagawang solusyon, na ang bawat isa ay tinutukoy ng isang pares ng mga tagapagpahiwatig (Moi, уi). Sa pamamagitan ng pagpapakita ng mga puntos na may mga coordinate (Moi, уi) sa coordinate plane, nakakakuha kami ng isang larawan ng uri na ipinapakita sa Fig. 1, ibig sabihin. nakuha namin ang espasyo ng mga pagtatantya. Kaliwang bahagi larawan (pulang tuldok) kahulugan inaasahan sa matematika kinuha namin ang positibo at y negatibong halaga, dahil Dapat nating bawasan ang pamantayang ito (y). Tama ang mga pagtatantya ng Pareto optimal itaas na limitasyon at, nang naaayon, Pareto pinakamainam na solusyon X1, X2, X9 at X7.

Sa halimbawang ito, ang hanay ng mga Pareto-optimal na solusyon ay X1, X2, X9, X7 at ang huling pagpili ng pinakamainam na solusyon ay ginawa mula sa set na ito. Tulad ng nabanggit sa itaas, mayroong dalawang diskarte dito: ang unang diskarte ay ang isang set ng Pareto-optimal na solusyon ay binuo at mula sa set na ito ang gumagawa ng desisyon ay pumipili ng isang natatanging solusyon batay sa mga impormal na karagdagang pagsasaalang-alang. Isaalang-alang natin ang pangalawang diskarte batay sa pagpapaliit sa hanay ng mga alternatibong Pareto-optimal.

  • 1. Pagpili ng pangunahing pamantayan at pagtatalaga ng mas mababang mga limitasyon para sa iba pang pamantayan. Magtalaga tayo ng lower bound ayon sa criterion M at bawasan ang criterion y. Bilang mas mababang limitasyon ng criterion M, kinukuha namin ang halaga ng M4 (tingnan ang Fig. 1), kung gayon ang pinakamainam na solusyon ay magiging X2, kaya kabilang sa mga solusyon na nagbibigay-kasiyahan sa kondisyon Mi? M4, ito ang pinakamababa sa peligro.
  • 2. Ang lexicographic optimization ay kinabibilangan ng pag-order ng pamantayan ayon sa kahalagahan. Hayaan, halimbawa, ang M ang pinakamahalagang pamantayan. Dahil ang tanging solusyon na X7 ay may pinakamataas na halaga ayon sa criterion M, ito ay pinakamainam. Malinaw na ipinapakita nito ang kawalan ng paraan ng pag-optimize ng lexicographic: isinasaalang-alang ang isang (pinakamahalaga) na pamantayan. Ang disbentaha na ito ay nauugnay sa pangangailangan na ipakilala ang isang mahigpit na priyoridad ng pamantayan at maaaring alisin sa pamamagitan ng pagpapahina sa "katigasan" ng mga priyoridad. Sa kasong ito, ang paraan ng sunud-sunod na mga konsesyon (paraan ng pagbabago ng layunin), na tinalakay sa itaas, ay ginagamit.

Halimbawa, sa aming kaso, bilang isang konsesyon ayon sa criterion M, ang halaga D na ipinahiwatig sa Fig. 1. Pagkatapos ang resulta ng pagpili sa unang hakbang ay magiging mga alternatibong X7, X8, X9. Kabilang sa mga ito, ang pinakamahusay ayon sa pangalawang pamantayan ay X9. Kaya, sa pamamagitan ng bahagyang pagbaba ng mga kinakailangan para sa pamantayan M, makabuluhang napabuti namin ang pagtatasa para sa pamantayan y (ibig sabihin, ang isang bahagyang pagbaba sa inaasahang pakinabang ay humantong sa isang makabuluhang pagbaba sa panganib).


kanin. 1.

Isaalang-alang natin ang aplikasyon ng isang pangkalahatang pamantayan para sa ating problema. Isaalang-alang natin bilang isang pangkalahatang pamantayan ang isang function ng form:

f(M, y)= M-lChu, (1)

kung saan ang l ay ilang pare-parehong halaga. Sa katunayan, ang criterion (1) ay kumakatawan sa isang additive optimality criterion para sa partial criteria M, y na may weighting coefficients 1 at - l. Kapag n>0, ang pagtatantya ng isang random na variable gamit ang additive criterion (1) ay mas mababa kaysa sa average na halaga nito, na karaniwan para sa maingat na tao, ibig sabihin. isang taong mahilig sa panganib. Sa kabaligtaran, kapag l<0 оценка (1) выше, чем среднее значение, что характеризует человека, склонного к риску. Наконец, при л=0 оценка случайной величины совпадает с её средним значением (т.е. возможные отклонения случайной величины от её среднего значения игнорируются) - это характеризует человека, безразличного к риску.

Ang substantive na kahulugan ng additive criterion (1) para sa n>0 ay ang pagtaas sa criterion na f(M, y) ay maaaring mangyari kapwa dahil sa pagtaas ng M ​​at dahil sa pagbaba ng y. Kaya, para sa isang taong ayaw sa panganib, ang criterion (1) ay sumasalamin sa pagnanais na taasan ang inaasahang pakinabang at bawasan ang panganib ng paglihis dito. Sa kasong ito, ang indicator l ay nagpapakilala sa subjective na saloobin ng gumagawa ng desisyon sa panganib. Samakatuwid, ang l ay maaaring ituring bilang isang subjective na tagapagpahiwatig ng isang sukatan ng pag-iwas sa panganib (subjective indicator ng pag-iingat).

Pagpili ng variant ng produktong gagawin. Ang kumpanya ay maaaring gumawa ng mga produkto mula sa sumusunod na anim na uri: payong (Z), jacket (K), kapote (P), bag (S), sapatos (T) at (W). Ang pinuno ng kumpanya ay dapat magpasya kung alin sa mga ganitong uri ng produkto ang gagawin sa paparating na panahon ng tag-init. Ang kita ng kumpanya ay nakasalalay sa kung anong uri ng tag-araw ito - maulan, mainit o katamtaman, at tinutukoy ng talahanayan 6. Aling pagpipilian sa produksyon ang magiging pinakamainam?

Sa kawalan ng karagdagang impormasyon tungkol sa mga estado ng kapaligiran sa ilalim ng mga kondisyon ng kawalan ng katiyakan, ang solusyon nito ay posible sa pamamagitan ng pagtanggap ng anumang hypothesis tungkol sa pag-uugali ng kapaligiran. Kung ang gumagawa ng desisyon ay may impormasyon tungkol sa mga posibilidad ng tag-ulan, mainit at katamtamang tag-araw, kung gayon ang tinukoy na problema ay magiging isang problema sa pagpapasya sa panganib. Sa kasong ito, ang kinakailangang impormasyon ay maaaring kunin mula sa istatistikal na data (mga obserbasyon ng panahon sa isang partikular na lugar). Ipagpalagay natin na ang posibilidad ng tag-ulan, mainit at katamtamang tag-araw ay 0.2, 0.5 at 0.3, ayon sa pagkakabanggit. Pagkatapos ay makukuha natin ang problema sa paggawa ng desisyon sa ilalim ng mga kondisyon ng peligro, ibinigay ng mesa 7.

Talahanayan 6.

Hanapin natin ang inaasahang mga kabayaran na tumutugma sa mga solusyong Z, K, P, S, T, W. Mayroon tayong:

MZ=0.2H80+0.5H60+0.3H40=58,

Mk=0.2H70+0.5H40+0.3H80=58,

MP=0.2H70+0.5H50+0.3H60=57,

MS=0.2H50+0.5H50+0.3H70=56,

MT=0.2H75+0.5H50+0.3H50=55,

DoZ=196, DoK=336, DoP=61, DoC=84, DoT=100, DoSh=231.5. Standard deviations ang mga random na variable na isinasaalang-alang ay:

yZ=14.0, yK=18.3, yP=7.8, yS=9.2, yT=10.0, ySh=15.2.

Gumawa tayo ng talahanayan ng mga halaga ng pamantayan M at y para sa bawat alternatibo (Talahanayan 8)

talahanayan 8

Pamantayan

Katawanin natin ang mga solusyon na isinasaalang-alang bilang mga punto sa coordinate plane ng mga variable na M at y, at makuha natin ang Fig. 2, kung saan ang mga Pareto-optimal na solusyon ay Z, P, Sh. Ang huling pagpili ng pinakamainam na alternatibo ay dapat gawin mula sa set na ito.

Magagawa lang ang pagpapaliit sa Pareto-optimal set (ideal sa isang elemento) kung mayroong karagdagang impormasyon tungkol sa kaugnayan sa pagitan ng pamantayan M at y. Tulad ng nabanggit sa itaas, ito ay maaaring gawin sa pamamagitan ng pangunahing pamamaraan ng pamantayan, ang paraan ng sunud-sunod na mga konsesyon, o paggamit ng lexicographic criterion.

Repasuhin ang pamantayan ng desisyon sa ilalim ng mga kondisyon ng peligro

Gumagana ang pamantayan

Ang panuntunan sa pagpili sa kasong ito ay binabalangkas tulad ng sumusunod:

Ang decision matrix ay dinagdagan ng isang bagong column na naglalaman ng mga produkto ng lahat ng mga resulta ng bawat hilera. Ang mga opsyon na iyon ay pinili kung saan ang mga linya ay naglalaman pinakamataas na halaga kolum na ito.

Ang paglalapat ng pamantayang ito ay dahil sa mga sumusunod na pangyayari:

  • · ang mga posibilidad ng paglitaw ng estado Bj ay hindi alam;
  • · ang hitsura ng bawat isa sa mga estado Bj nang hiwalay ay dapat isaalang-alang;
  • · ang criterion ay naaangkop din para sa isang maliit na bilang ng mga pagpapatupad ng solusyon;
  • · ang ilang panganib ay katanggap-tanggap.

Ang pamantayan ng produkto ay pangunahing iniangkop para sa mga kaso kung saan ang lahat ng aij ay positibo. Kung ang positivity condition ay nilabag, kung gayon ang ilang shift aij+a na may ilang pare-parehong a> ay dapat isagawa. Ang resulta ay natural na nakasalalay sa a. Sa pagsasanay madalas

Kung walang permanenteng makikilala bilang may kahulugan, hindi naaangkop ang pamantayan ng produkto.

Nakaraang Tahanan Susunod

Paggawa ng desisyon sa ilalim ng mga kondisyon ng peligro na may posibilidad na magsagawa ng isang eksperimento

Kapag gumagawa ng desisyon sa ilalim ng mga kondisyon ng kawalan ng katiyakan (o sa ilalim ng mga kondisyon ng peligro), ang pangunahing kahirapan sa pagpili ng solusyon ay lumitaw dahil sa kamangmangan ng gumagawa ng desisyon sa totoong kalagayan ng kapaligiran. Sa nakaraang mga lektura, ilang pamantayan ang isinasaalang-alang, na ang bawat isa ay "lumalaban" sa kawalan ng katiyakan sa sarili nitong paraan: sa pamamagitan ng paglalagay ng hypothesis tungkol sa pag-uugali ng kapaligiran (ang pamantayan ng Laplace, Wald, Hurwitz at Savage); sa pamamagitan ng pag-average ng mga resultang natamo (Bayes-Laplace criterion o inaasahang gain criterion); sa pamamagitan ng pagsasaalang-alang sa parehong inaasahang pakinabang at ang sukatan ng paglihis mula rito. Gayunpaman, ang bawat isa sa mga pamamaraang ito ay nagbibigay lamang ng isang paraan upang makatuwirang pag-aralan ang kawalan ng katiyakan, nang hindi inaalis ang kawalan ng katiyakan mismo. Ang pag-aalis o hindi bababa sa pagbabawas ng kawalan ng katiyakan ay maaaring isagawa lamang sa batayan ng paglilinaw sa tunay na kalagayan ng kapaligiran.

Sa pagsasagawa, ang naturang paglilinaw ay isinasagawa, bilang panuntunan, sa pamamagitan ng pagkolekta ng karagdagang impormasyon, pati na rin sa pagsasagawa ng mga eksperimento, ang mga resulta nito ay ginagamit upang hatulan ang kasalukuyang kalagayan ng kapaligiran. Halimbawa, bago simulan ang paggamot ng isang pasyente na may hindi malinaw na diagnosis, ang doktor ay nagsasagawa karagdagang mga pagsubok; Bago mag-drill ng mamahaling balon ng langis, isang geologist ang nagsasagawa ng seismic exploration; Bago simulan ang paggawa ng anumang produkto, ang negosyante ay gumagawa ng isang pagsubok na batch ng produktong ito, atbp. Sa loob ng balangkas ng teorya sa paggawa ng desisyon, ang lahat ng mga pagkilos na ito ay walang iba kundi ang pagsasagawa ng eksperimento upang linawin ang kalagayan ng kapaligiran.

Ang isang eksperimento ay tinatawag na perpekto kung, batay sa mga resulta nito, kinikilala ng gumagawa ng desisyon ang tunay na kalagayan ng kapaligiran. Sa pagsasagawa, ang pagkakaroon ng perpektong eksperimento ay medyo bihira. Kadalasan, ang resulta ng isang eksperimento ay nagbibigay ng ilang impormasyon kung saan maaaring linawin ang kapaligiran.

Paano gamitin ang mga resulta ng eksperimento at magagamit na istatistikal na data kapag gumagawa ng mga desisyon nang pinakamabisa? Ang isa sa mga pamamaraan upang malutas ang problemang ito ay batay sa pormula ng Bayes - isang pormula para sa muling pagtatantya ng mga probabilidad ng mga kaganapan na isinasaalang-alang ang mga resulta ng eksperimento.

Tandaan na ang eksperimento ay hindi posible para sa bawat problema sa paggawa ng desisyon. Kung ang isang eksperimento ay posible para sa isang tiyak na gawain, pagkatapos ay ang gawain ng pagtatasa ng pagiging posible ng pagpapatupad nito arises. Ang katotohanan ay ang pagsasagawa ng isang eksperimento ay palaging nangangailangan ng mga gastos (materyal, organisasyon, oras, atbp.).

Ipinapakita ng [Rosen] na ang isang perpektong eksperimento ay kumikita kung at kung ang halaga nito ay mas mababa sa minimum na inaasahang panganib:

kung saan ang rij ay mga panganib, ang C ay ang halaga ng eksperimento.

Upang ipakita ang pamamaraang Bayesian sa muling pagtatantya ng mga probabilidad, alalahanin natin ang ilang mga konsepto mula sa teorya ng probabilidad.

Ang kondisyon na posibilidad ng kaganapan A na ibinigay na ang kaganapan B ay naganap ay tinutukoy ng P(A/B) at kinakalkula ng formula

Isaalang-alang natin ang sumusunod na probability-theoretic scheme. Hayaang ang B1, B2, …, Bm ay isang kumpletong pangkat ng mga kaganapan at para sa bawat kaganapan Bj, j= ang posibilidad nito P(Bj) ay kilala. Hayaang magsagawa ng isang eksperimento bilang resulta kung saan nangyari ang kaganapan A. Kung ang mga kondisyong probabilidad na P(A/Bj) para sa lahat ng j= ay kilala, kung gayon ang posibilidad na may kondisyon (pagkatapos ng eksperimentong) probabilidad ng kaganapan Bj (j=, ) ay matatagpuan gamit ang formula ng Bayes

Isaalang-alang natin ngayon sa schematic form ang problema sa paggawa ng desisyon sa ilalim ng mga kondisyon ng peligro, na tinukoy gamit ang isang payoff matrix, na mayroong form table.

Talahanayan 1. Payment matrix na may probabilistikong vector ng estado ng kapaligiran

Mga estado sa kapaligiran

Narito ang B1, B2, …, Bm ay ang mga estado ng kapaligiran, ang aij ay ang kabayaran ng manlalaro sa sitwasyon kapag pinili niya ang diskarte Xi, at ang kapaligiran ay tumatagal ng estado Bj. Alam ng gumagawa ng desisyon ang posibilidad na P(Bj)= qj ng paglitaw ng estado Bj, at P(Bj)?0 at. Ipinapalagay na ang daluyan ay maaaring nasa isa at isa lamang sa mga estadong B1, B2, ..., Bm. Sa madaling salita, ang mga random na kaganapan B1, B2, ..., Bm ay bumubuo ng isang kumpletong pangkat ng mga kaganapan, upang maaari silang kunin bilang mga hypotheses. Ang mga probabilidad ng mga estado ng kapaligiran na kilala ng gumagawa ng desisyon na P(Bj) (j=) ay mga unconditional (pre-experimental, a priori) probabilities.

Ipagpalagay natin na ang ilang eksperimento ay isinasagawa, ang resulta nito ay depende sa umiiral na kalagayan ng kapaligiran. Kung, bilang resulta ng eksperimento, ang kaganapan A ay naobserbahan at, bilang karagdagan, ang mga kondisyon na probabilidad na P(A/Bj) ay kilala para sa lahat ng j=, pagkatapos ay gamit ang formula ng Bayes, mahahanap ng isa ang post-experimental (posterior) mga probabilidad ng bawat estado ng kapaligiran. Ang kaalaman sa mga pinong probabilidad ng mga estado sa kapaligiran ay nagbibigay-daan sa iyo na mas tumpak na tukuyin ang diskarte ng gumagawa ng desisyon.

Ang inilarawang diskarte sa paggawa ng desisyon sa ilalim ng panganib ay tinatawag na Bayesian, dahil ito ay batay sa formula ng Bayes. Ang pamamaraang ito ay inilalarawan ng halimbawang tinalakay sa ibaba.

Gawain. Pagbabarena ng balon ng langis.

Ang pinuno ng pangkat ng paghahanap ay dapat gumawa ng desisyon: mag-drill ng isang balon ng langis o hindi. Ang balon ay maaaring maging "tuyo" (C), i.e. walang langis, "mababang kapangyarihan" (M), i.e. na may mababang nilalaman ng langis, at "mayaman" (B), i.e. na may mataas na nilalaman ng langis. Ang mga alternatibo ng lider ng grupo ay: x1 - drill at x2 - huwag mag-drill. Ang netong kita kapag pumipili ng isa sa mga alternatibo, depende sa posibleng uri ng balon, ay ipinapakita sa talahanayan ng kita (tingnan ang Talahanayan 1)

Talahanayan 1. Payment matrix

Well type

Bilang karagdagan, alam ng pinuno ng pangkat ng paghahanap na sa isang partikular na lugar ang mga probabilidad ng isang tuyo, manipis o mayaman na balon ay ang mga sumusunod: P(C)=0.5, P(M)=0.3, P(B)=0.2.

Ang pinuno ng pangkat ng paghahanap ay maaaring magsagawa ng isang eksperimento upang linawin ang istraktura ng lupa (estado ng kapaligiran). Ang eksperimentong ito ay isang seismic survey, ang resulta nito ang magiging sagot - ano ang istraktura ng lupa sa isang partikular na lugar (ngunit hindi ang sagot sa tanong tungkol sa uri ng balon!). Sa prinsipyo, ang istraktura ng lupa ay maaaring bukas (O) o sarado (C). Ang pinuno ng pangkat ay may talahanayan ng mga resulta ng mga eksperimento na ibinigay sa lugar na ito (tingnan ang Talahanayan 2).

Talahanayan 2. Talahanayan ng pang-eksperimentong datos

Ipinapakita ng talahanayang ito kung gaano karaming beses ang mga balon ng uri C, M, B ay nakatagpo sa mga lupa ng bukas at saradong istraktura ng mga lupa (ibig sabihin, nagbibigay ito ng magkasanib na istatistika ng lupa at uri ng mga balon para sa isang partikular na lugar).

Suriin natin ang pang-eksperimentong data ng resultang talahanayan. Ipagpalagay natin na ang n mga eksperimento ay isinagawa, ang mga resulta kung saan ay ang mga halaga ng discrete random variable X (uri ng balon) at Y (istraktura ng lupa), na kumukuha ng mga halaga C, M, B at O, Z, ayon sa pagkakabanggit. Tukuyin natin sa pamamagitan ng n11 ang bilang ng mga eksperimento kung saan ang X = C at Y=O, pagkatapos ng n12 ang bilang ng mga eksperimento kung saan X=C at Y=Z, pagkatapos ng n21 ang bilang ng mga eksperimento kung saan X=M at Y=O, atbp. Sa aming kaso n=100, n11=45, n12=5, n21=11. Hinahati ang mga halaga sa Talahanayan 2 ng 100 (sa bilang ng mga eksperimento na isinagawa), nakuha namin ang batas ng pamamahagi ng isang dalawang-dimensional na random na variable (X, Y) na ibinigay sa tabular form (tingnan ang Talahanayan 3).

Talahanayan 3. Serye ng istatistika pamamahagi ng two-dimensional r.v. (X, Y)

Mula sa Talahanayan 3 sumusunod na P(X=C)=P(C)=0.5, P(X=M)=P(M)=0.3, P(X=B)=P(B)=0.2; Р(Y=O)=P(O)=0.6, Р(Y=З)=P(З)=0.4,

Kaya, ang pinuno ng grupo ay dapat magpasya:

  • · kung magsasagawa ng isang eksperimento (ang gastos nito ay 10 mga yunit);
  • · kung natupad, kung gayon kung ano ang gagawin sa hinaharap depende sa mga resulta ng eksperimento.

Kaya, ang isang multi-step na problema sa paggawa ng desisyon sa ilalim ng mga kondisyon ng peligro ay nakuha. Ilarawan natin ang paraan para sa paghahanap ng pinakamainam na solusyon.

Hakbang 1. Bumuo tayo ng isang puno (Larawan 1), na nagpapahiwatig ng lahat ng mga yugto ng proseso ng paggawa ng desisyon - isang puno ng desisyon. Ang mga sanga ng puno ay tumutugma sa mga posibleng alternatibo, at ang mga vertex ay tumutugma sa mga umuusbong na sitwasyon. Ang mga alternatibo para sa pinuno ng pangkat sa paghahanap ay: b - pagtanggi sa eksperimento, c - pagsasagawa ng eksperimento, x1 - drill, x2 - hindi drill. Mga estado ng kalikasan: pagpili ng uri ng balon (C, M, B), pati na rin ang pagpili ng istraktura ng lupa (O, W).

Tinutukoy ng itinayong puno ang paglalaro ng pinuno ng grupo sa kalikasan. Ang mga posisyon ng larong ito ay ang mga vertex ng puno, at ang mga galaw ng mga manlalaro ay ang mga solusyon na kanilang pinili. Ang mga posisyon kung saan kumikilos ang pinuno ng grupo ay inilalarawan ng isang parihaba; ang mga posisyon kung saan ang kalikasan ay gumagawa ng paggalaw ay binibilog.

Ang laro ay nagpapatuloy tulad ng sumusunod. Sa panimulang posisyon, ang pinuno ng grupo ay gumagawa ng paglipat. Dapat siyang gumawa ng desisyon - tanggihan ang eksperimento (piliin ang solusyon b) o isagawa ang eksperimento (piliin ang solusyon c). Kung inabandona niya ang eksperimento, lilipat ang laro sa susunod na posisyon kung saan dapat magdesisyon ang lider ng grupo: mag-drill (pumili ng alternatibong x1) o hindi mag-drill (pumili ng alternatibong x2). Kung siya ay nagpasya na magsagawa ng isang eksperimento, pagkatapos ay ang laro ay lilipat sa isang posisyon kung saan ang kalikasan ay gumagawa ng isang paglipat, pagpili ng isa sa mga estado O o Z, naaayon posibleng resulta eksperimento, atbp. Nagtatapos ang laro kapag naabot na nito ang huling posisyon (i.e. ang tuktok ng puno kung saan walang mga sanga na nagmumula rito)

Hakbang 2. Para sa bawat desisyon na isang paglipat ng kalikasan (iyon ay, ito ay nagmumula sa posisyon na inilalarawan ng isang bilog), kailangan nating hanapin ang posibilidad ng paglipat na ito. Upang gawin ito, magpatuloy kami bilang mga sumusunod. Para sa bawat posisyon ng puno, mayroong isang solong landas na nagkokonekta sa posisyong iyon sa panimulang posisyon. Kung ito ay para sa posisyon ng kalikasan, ang landas na nag-uugnay dito sa unang posisyon ay hindi dumadaan sa posisyon (E), ibig sabihin ay ang eksperimento, kung gayon ang mga probabilidad ng mga estadong P(S), P(M) at P(B ) ay walang kondisyon (pre-experimental) at mula sa talahanayan. 3:

P(S)=50/100, P(M)=30/100, P(B)=20/100.

Kung, para sa posisyon ng kalikasan, ang landas na nag-uugnay dito sa paunang posisyon ay dumaan sa posisyon (E), kung gayon ang mga probabilidad ng mga estado ng kapaligiran ay nagiging kondisyon na mga probabilidad at matatagpuan ayon sa mga formula (1), gamit ang data sa Talahanayan. . 3:

Sa posisyon (E), ang mga probabilidad ng mga paggalaw na humahantong sa mga posisyon (O) at (W) ay matatagpuan mula sa Talahanayan 3: P(O)=0.6, P(Z)=0.4.


kanin. 1.

Hakbang 3. Suriin natin ang lahat ng mga posisyon ng puno ng laro, "pababa" mula sa mga huling posisyon hanggang sa una. Ang pagsusuri ng isang posisyon ay ang inaasahang panalo sa posisyong ito. Nakahanap kami ng mga pagtatantya para sa mga huling posisyon mula sa Talahanayan 2. Ipinapahiwatig namin ngayon ang isang paraan para sa paghahanap ng isang pagtatantya para sa isang di-makatwirang posisyon ng puno ng laro sa ilalim ng pagpapalagay na ang mga pagtatantya para sa lahat ng mga posisyon kasunod nito ay natagpuan na.

Para sa posisyon ng kalikasan, ang pagtatasa nito ay kumakatawan sa inaasahang pakinabang (tingnan ang Larawan 2);

Para sa posisyon ng manlalaro, ang pagtatantya ay ang maximum ng lahat ng posisyon sa likod nito. Motibo: sa "kanyang" posisyon ang manlalaro ay maaaring gumawa ng anumang hakbang, kaya pipiliin niya ang isa na hahantong sa pinakamalaking posibleng panalo (tingnan ang Larawan 3). Sa bawat posisyon, minarkahan ng manlalaro ng gitling ang sangay ng puno na humahantong sa posisyon na may pinakamataas na marka.


Lumiko tayo sa Fig. 1. Nalaman namin na sa paunang posisyon ang inaasahang tubo nang hindi nagsasagawa ng eksperimento (alternatibong b) ay 20 yunit; ang inaasahang tubo sa eksperimento (alternatibong c) ay 28 units. Kaya, ang angkop na solusyon ay ang pagsasagawa ng eksperimento (seismic exploration). Dagdag pa, kung ang eksperimento ay nagpapakita na ang lupa ay bukas, pagkatapos ay hindi dapat gawin ang pagbabarena, ngunit kung ito ay sarado, pagkatapos ay ang pagbabarena ay dapat gawin.

  • 1 - sangay: =20
  • 2 - sangay: 0
  • 3 - sangay:= -30
  • 4 - sangay: 0
  • 5 - sangay: =95
  • 6 - sangay: 0

Tulad ng mga sumusunod mula sa mga kondisyon ng problema, makakakuha tayo ng isang halaga ng 95 mga yunit na may posibilidad na 0.4. Samakatuwid, ang inaasahang panalo ay 0.4*95=38 units. Ibinabawas namin ang halaga ng eksperimento na katumbas ng 10 unit.

Bilang resulta, nakakakuha tayo ng 28 units.

Ang mga puno ng desisyon ay hierarchically kumakatawan sa lohikal na istraktura ng paggawa ng desisyon, at sa gayon ay pinapadali ang pag-unawa sa problema at ang proseso ng paglutas nito. Hindi tulad ng decision matrix, dito makikita ang takbo ng oras ng proseso ng paggawa ng desisyon. Ang isang puno ng desisyon ay hindi maaaring, gayunpaman, sa pangkalahatan ay kinakatawan ng isang simpleng decision matrix; Tanging mga indibidwal na yugto ng proseso ang maaaring katawanin sa ganitong paraan. Ang paghahati sa mga yugto ay isinasagawa upang ang pagpili ng solusyon ay nagsisimula sa isang tiyak na node ng desisyon, kung saan nagmumula ang isa o higit pang mga sangay, na kumakatawan sa mga pagpipilian sa solusyon. Sinusundan ito ng mga node ng kaganapan at sa dulo - dahon" na kumakatawan sa mga huling estado na nagpapahiwatig ng mga halaga ng kaukulang mga parameter ng output. Kung ang mga node ng kaganapan ay muling sinusundan ng isang node ng desisyon na may kaukulang mga aksyon, kung gayon ito at ang lahat ng kasunod na mga sangay nauugnay sa higit pa Huling yugto pagpili ng solusyon.. Kaya, maaari mong subaybayan ang buong landas mula sa simula hanggang sa dulo ng puno ng desisyon.

Ang isang puno ng desisyon ay nakikilala sa pagitan ng mga node ng kaganapan at mga node ng desisyon. Maaaring isipin ng isa na sa mga node ng kaganapan ang pagpili ng karagdagang landas ay tinutukoy panlabas na kondisyon(sa kalikasan, sa teorya ng laro ng kalaban), at sa mga node ng desisyon ng gumagawa ng desisyon.

Ang mga puno ng desisyon ay madaling baguhin: kung kinakailangan, maaari silang higit pang paunlarin, at sa mga kaso kung saan ang ilang mga sangay ay halos walang kahulugan, maaari silang bawasan nang naaayon. Ang mga node ng desisyon, kung nauugnay ang mga ito sa isang aksyon at hindi pinaghihiwalay ng mga node ng kaganapan, ay maaaring pagsamahin. Ang parehong ay totoo para sa mga node ng kaganapan.



Bago sa site

>

Pinaka sikat