Bahay Pag-iwas Teorya ng larong matematika. Mga halimbawa ng pag-record at paglutas ng mga laro mula sa buhay

Teorya ng larong matematika. Mga halimbawa ng pag-record at paglutas ng mga laro mula sa buhay

Kung mayroong ilang mga magkasalungat na partido (mga tao), ang bawat isa ay gumagawa ng isang tiyak na desisyon na tinutukoy ng isang naibigay na hanay ng mga patakaran, at ang bawat isa sa mga tao ay nakakaalam ng panghuling estado ng sitwasyon ng salungatan na may mga pagbabayad na paunang natukoy para sa bawat isa sa mga partido, pagkatapos ay isang laro magaganap daw.

Ang gawain ng teorya ng laro ay pumili ng isang linya ng pag-uugali para sa isang naibigay na manlalaro, ang paglihis mula sa kung saan ay maaari lamang mabawasan ang kanyang mga panalo.

Ang ilang mga kahulugan ng laro

Ang quantitative assessment ng mga resulta ng laro ay tinatawag na pagbabayad.

Doble (dalawang tao) ay tinatawag na zero-sum game kung ang kabuuan ng mga pagbabayad ay zero, i.e. kung ang pagkatalo ng isang manlalaro ay katumbas ng nakuha ng isa pa.

Ang isang hindi malabo na paglalarawan ng pagpili ng isang manlalaro sa bawat posibleng sitwasyon kung saan kailangan niyang gumawa ng personal na hakbang ay tinatawag diskarte ng manlalaro .

Ang diskarte ng isang manlalaro ay tinatawag na pinakamainam kung, kapag ang laro ay paulit-ulit na maraming beses, ito ay nagbibigay sa manlalaro ng maximum na posible. average na panalo(o, na parehong bagay, ang pinakamababang posibleng average na panalo).

Ang laro ay tinukoy ng isang matrix A pagkakaroon m mga linya at n Ang mga column ay tinatawag na finite pair game of dimension m* n;

saan i=
- diskarte ng unang manlalaro na may mstratehiya; j=- diskarte ng pangalawang manlalaro na may n diskarte; ij– ang mga panalo ng unang manlalaro i-diskarte kapag ginamit ng pangalawa j ika diskarte (o, ano ang parehong bagay, ang pagkawala ng pangalawa sa kanyang j-ika na diskarte, kapag ginamit muna i ika);

A =  ij– payment matrix ng laro.

1.1 Paglalaro ng mga purong estratehiya

Mababang presyo ng laro (para sa unang manlalaro)

= max (min ij). (1.2)

i j

Nangungunang presyo ng laro (para sa pangalawang manlalaro):

= min (max ij) . (1.3)

J i

Kung = , ang laro ay tinatawag na saddle point game (1.4), o isang laro na may mga purong diskarte. Kung saan V = = tinatawag na mahalagang laro ( V- presyo ng laro).

Halimbawa. Ang payment matrix ng 2-person game A ay ibinigay. Tukuyin pinakamainam na estratehiya para sa bawat manlalaro at ang presyo ng laro:

(1.4)

max 10 9 12 6

i

min 6

j

- diskarte ng unang manlalaro (hilera).

Pangalawang diskarte ng manlalaro (mga hanay).

- presyo ng laro.

Kaya, ang laro ay may saddle point. Diskarte j = 4 – pinakamainam na diskarte para sa pangalawang manlalaro i=2 - para sa una. Mayroon kaming isang laro na may purong diskarte.

1.2 Mga larong may halo-halong estratehiya

Kung ang payment matrix ay walang saddle point, i.e.
, at walang sinuman sa laro ang maaaring pumili ng isang plano bilang kanilang pinakamainam na diskarte, ang mga manlalaro ay lumipat sa "halo-halong mga diskarte." Bukod dito, ginagamit ng bawat manlalaro ang bawat isa sa kanyang mga diskarte nang maraming beses sa panahon ng laro.

Ang isang vector, na ang bawat isa sa mga bahagi ay nagpapakita ng relatibong dalas ng paggamit ng manlalaro ng katumbas na purong diskarte, ay tinatawag na pinaghalong diskarte ng manlalarong ito.

X= (X 1 …X i …X m) – pinaghalong diskarte ng unang manlalaro.

U= (sa 1 ...y j ...y n) – pinaghalong diskarte ng pangalawang manlalaro.

xi , y j– mga kamag-anak na frequency (mga probabilidad) ng mga manlalaro na gumagamit ng kanilang mga diskarte.

Mga kundisyon para sa paggamit ng magkahalong estratehiya

. (1.5)

Kung X* = (X 1 * ….X ako*… X m*) – pinakamainam na diskarte na pinili ng unang manlalaro; Y* = (sa 1 * …sa j*... sa n*) ay ang pinakamainam na diskarte na pinili ng pangalawang manlalaro, pagkatapos ang numero ay ang halaga ng laro.

(1.6)

Para sa numero V ay ang presyo ng laro, at X* At sa* - pinakamainam na mga diskarte, ito ay kinakailangan at sapat upang masiyahan ang mga hindi pagkakapantay-pantay

(1.7)

Kung ang isa sa mga manlalaro ay gumagamit ng pinakamainam na pinaghalong diskarte, kung gayon ang kanyang kabayaran ay katumbas ng halaga ng laro V anuman ang dalas na gagamitin ng pangalawang manlalaro ang mga diskarte na kasama sa pinakamainam, kabilang ang mga purong diskarte.

Pagbawas ng mga problema sa teorya ng laro sa mga problema sa linear programming.

Halimbawa. Maghanap ng solusyon sa larong tinukoy ng payoff matrix A.

A = (1.8)

y 1 y 2 y 3

Solusyon:

Gumawa tayo ng dalawahang pares ng mga problema sa linear programming.

Para sa unang manlalaro

(1.9)

sa 1 +sa 2 +sa 3 = 1 (1.10)

Palayain ang iyong sarili mula sa variable V(presyo ng laro), hatiin ang kaliwa at kanang bahagi ng mga expression (1.9), (1.10) sa V. Tinanggap sa j /V para sa isang bagong variable z i, nakukuha namin bagong sistema mga paghihigpit (1.11) at target na function (1.12)

(1.11)

. (1.12)

Katulad nito, nakukuha namin ang modelo ng laro para sa pangalawang manlalaro:

(1.13)

X 1 +X 2 +X 3 = 1 . (1.14)

Pagbabawas ng modelo (1.13), (1.14) sa isang form na walang variable V, nakukuha namin

(1.15)

, (1.16)

saan
.

Kung kailangan nating matukoy ang diskarte sa pag-uugali ng unang manlalaro, i.e. relatibong dalas ng paggamit ng kanyang mga estratehiya ( X 1 ….X i …X m), gagamitin namin ang modelo ng pangalawang manlalaro, dahil ang mga variable na ito ay nasa kanyang modelo ng kabayaran (1.13), (1.14).

Bawasan natin ang (1.15), (1.16) sa canonical form

(1.17)

Pansinin! Ang solusyon sa iyong partikular na problema ay magiging katulad ng halimbawang ito, kabilang ang lahat ng mga talahanayan, mga tekstong nagpapaliwanag at mga numero na ipinakita sa ibaba, ngunit isinasaalang-alang ang iyong paunang data...

Gawain:
Ang matrix game ay ibinibigay ng sumusunod na payoff matrix:

Mga diskarte "B"
Istratehiya "A" B 1B 2
A 1 3 5
A 2 6
3
2

Hanapin ang solusyon sa larong matrix, katulad ng:
- hanapin ang pinakamataas na presyo ng laro;
- Mas mababang presyo laro;
- netong presyo ng laro;
- ipahiwatig ang pinakamainam na diskarte ng mga manlalaro;
- dalhin graphic na solusyon(geometric na interpretasyon), kung kinakailangan.

Hakbang 1

Alamin natin ang mas mababang presyo ng laro - α

Pinakamababang presyo ng laro Ang α ay ang pinakamataas na panalo na magagarantiyahan natin sa ating sarili sa isang laro laban sa isang makatwirang kalaban kung gagamit tayo ng isa at isang diskarte lamang sa buong laro (tinatawag na “pure” ang diskarteng ito).

Hanapin natin sa bawat row ng payment matrix pinakamababa elemento at isulat ito sa isang karagdagang column (Pinili dilaw tingnan ang Talahanayan 1).

Pagkatapos ay hahanapin natin maximum elemento ng karagdagang column (minarkahan ng asterisk), ito ang magiging mas mababang presyo ng laro.

Talahanayan 1

Mga diskarte "B"
Istratehiya "A" B 1B 2 Hanay na Minima
A 1 3 5 3 *
A 2 6
3
2
3
2

Sa aming kaso, ang mas mababang presyo ng laro ay: α = 3, at upang magarantiya ang isang panalo na hindi mas masahol pa sa 3 dapat tayong manatili sa diskarte A 1

Hakbang:2

Alamin natin ang pinakamataas na presyo ng laro - β

Nangungunang presyo ng laro Ang β ay ang pinakamababang pagkawala na magagarantiyahan ng player B sa kanyang sarili sa isang laro laban sa isang makatwirang kalaban kung gagamit siya ng isa at isang diskarte lamang sa buong laro.

Hanapin natin sa bawat column ng payment matrix maximum elemento at isulat ito sa isang karagdagang linya sa ibaba (naka-highlight sa dilaw, tingnan ang Talahanayan 2).

Pagkatapos ay hahanapin natin pinakamababa elemento ng karagdagang linya (minarkahan ng plus), ito ang magiging pinakamataas na presyo ng laro.

talahanayan 2

Mga diskarte "B"
Istratehiya "A" B 1B 2 Hanay na Minima
A 1 3 5 3 *
A 2 6
3
2

Sa aming kaso, ang pinakamataas na presyo ng laro ay: β = 5, at upang magarantiya ang isang pagkatalo na hindi hihigit sa 5, ang kalaban (manlalaro "B") ay dapat sumunod sa diskarte B 2

Hakbang:3
Ihambing natin ang mas mababa at mas mataas na mga presyo ng laro; sa problemang ito ay nagkakaiba sila, i.e. α ≠ β, ang payoff matrix ay hindi naglalaman ng saddle point. Nangangahulugan ito na ang laro ay walang solusyon sa mga purong minimax na diskarte, ngunit ito ay palaging may solusyon sa halo-halong mga diskarte.

Pinaghalong diskarte, ito ay mga purong diskarte na random na nagpapalit-palit, na may ilang partikular na probabilidad (mga frequency).

Ipapahiwatig namin ang pinaghalong diskarte ng player na "A"

S A=

kung saan ang B 1, B 2 ay ang mga diskarte ng manlalaro na "B", at ang q 1, q 2 ay, ayon sa pagkakabanggit, ang mga probabilidad kung saan inilalapat ang mga estratehiyang ito, at q 1 + q 2 = 1.

Ang pinakamainam na pinaghalong diskarte para sa manlalarong "A" ay ang nagbibigay sa kanya ng pinakamataas na kabayaran. Alinsunod dito, para sa "B" mayroong isang minimum na pagkawala. Ang mga estratehiyang ito ay itinalaga S A* at S B* ayon sa pagkakabanggit. Ang isang pares ng pinakamainam na diskarte ay bumubuo ng isang solusyon sa laro.

SA pangkalahatang kaso Maaaring hindi kasama sa pinakamainam na diskarte ng manlalaro ang lahat ng paunang diskarte, ngunit ilan lamang sa mga ito. Ang mga ganitong estratehiya ay tinatawag aktibong mga estratehiya.

Hakbang:4


saan: p 1 , p 2 - probabilities (frequencies) kung saan inilalapat ang mga diskarte A 1 at A 2, ayon sa pagkakabanggit

Mula sa teorya ng laro, alam na kung ang manlalaro na "A" ay gumagamit ng kanyang pinakamainam na diskarte, at ang manlalaro na "B" ay nananatili sa loob ng balangkas ng kanyang mga aktibong diskarte, kung gayon ang average na kabayaran ay nananatiling hindi nagbabago at katumbas ng halaga ng laro v hindi alintana kung paano ginagamit ng manlalaro na si "B" ang kanyang mga aktibong diskarte. At sa aming kaso, ang parehong mga diskarte ay aktibo, kung hindi, ang laro ay magkakaroon ng solusyon sa mga purong diskarte. Samakatuwid, kung ipagpalagay namin na ang manlalarong "B" ay gagamit ng isang purong diskarte B 1, kung gayon ang average na kabayaran v magiging:

k 11 p 1 + k 21 p 2 = v (1)

saan: k ij - mga elemento ng matrix ng pagbabayad.

Sa kabilang banda, kung ipagpalagay natin na ang manlalarong “B” ay gagamit ng purong diskarte B 2, ang average na kabayaran ay:

k 12 p 1 + k 22 p 2 = v (2)

Ang equating sa kaliwang bahagi ng mga equation (1) at (2) ay nakukuha natin:

k 11 p 1 + k 21 p 2 = k 12 p 1 + k 22 p 2

At isinasaalang-alang ang katotohanan na p 1 + p 2 = 1 meron kami:

k 11 p 1 + k 21 (1 - p 1 ) = k 12 p 1 + k 22 (1 - p 1 )


Kung saan madaling mahanap ang pinakamainam na dalas ng diskarte A 1:
p 1 =
k 22 - k 21
k 11 + k 22 - k 12 - k 21
(3)

Sa gawaing ito:

p 1 =
3
2
- 6
3 +
3
2
- 5 - 6
=
9
13

Probability R 2 hanapin sa pamamagitan ng pagbabawas R 1 mula sa unit:
p 2 = 1 - p 1 = 1 -
9
13
= + 6 ·

saan: q 1 , q 2 - mga probabilidad (mga frequency) kung saan inilalapat ang mga diskarte B 1 at B 2, ayon sa pagkakabanggit

Mula sa teorya ng laro, alam na kung ang manlalaro na "B" ay gumagamit ng kanyang pinakamainam na diskarte, at ang manlalaro na "A" ay nananatili sa loob ng balangkas ng kanyang mga aktibong diskarte, kung gayon ang average na kabayaran ay nananatiling hindi nagbabago at katumbas ng halaga ng laro v hindi alintana kung paano ginagamit ng manlalaro A ang kanyang mga aktibong diskarte. Samakatuwid, kung ipagpalagay namin na ang manlalarong "A" ay gagamit ng isang purong diskarte A 1, kung gayon ang average na kabayaran v magiging:

k 11 q 1 + k 12 q 2 = v (4)


Dahil ang presyo ng laro v alam na natin at isinasaalang-alang iyon q 1 + q 2 = 1 , kung gayon ang pinakamainam na dalas ng diskarte B 1 ay makikita bilang:
q 1 =
v - k 12
k 11 - k 12
(5)

Sa gawaing ito:

q 1 =
51
13
- 5
3 - 5
=
7
13

Probability q 2 hanapin sa pamamagitan ng pagbabawas q 1 mula sa unit:
q 2 = 1 - q 1 = 1 -
7
13
=
6
13

Sagot:

Pinakamababang presyo ng laro: α = 3
Nangungunang presyo ng laro: β = 5
Presyo ng laro: v =
51
13
Ang pinakamainam na diskarte ng Player A:
S A*=
A 1A 2
9
13
4
13

Pinakamainam na diskarte para sa player na "B":
S B*=
B 1B 2
7
13
6
13

Geometric na interpretasyon (graphical na solusyon):

Magbigay tayo ng geometric na interpretasyon sa larong isinasaalang-alang. Kumuha ng isang seksyon ng abscissa axis ng haba ng yunit at gumuhit ng mga patayong tuwid na linya sa mga dulo nito a 1 At a 2 naaayon sa aming mga estratehiya A 1 at A 2 . Ipagpalagay natin ngayon na ang manlalarong "B" ay gagamit ng diskarte B 1 in purong anyo. Pagkatapos, kung tayo (manlalaro na "A") ay gumamit ng isang purong diskarte A 1, ang ating kabayaran ay magiging 3. Markahan natin ang kaukulang punto sa axis a 1 .
Kung gagamit tayo ng purong diskarte A 2, ang ating kabayaran ay magiging 6. Markahan natin ang kaukulang punto sa axis a 2
(tingnan ang Fig. 1). Malinaw, kung ilalapat natin, ang paghahalo ng mga estratehiya A 1 at A 2 sa magkaibang sukat, ang ating mga panalo ay magbabago sa isang tuwid na linya na dumadaan sa mga puntos na may mga coordinate (0, 3) at (1, 6), tawagin natin itong linya ng diskarte B 1 (sa Fig. 1 na ipinapakita sa pula). Ang abscissa ng anumang punto sa isang naibigay na linya ay katumbas ng posibilidad p 2 (frequency) kung saan inilalapat namin ang diskarte A 2, at ang ordinate - ang nagresultang pakinabang k (tingnan ang Fig. 1).

Larawan 1.
Payoff graph k mula sa dalas p 2 , kapag ginamit ng kalaban ang diskarte B 1.

Ipagpalagay natin ngayon na ang manlalarong "B" ay gagamit ng diskarte B 2 sa dalisay nitong anyo. Pagkatapos, kung kami (manlalaro "A") ay gumamit ng purong diskarte A 1, ang aming kabayaran ay magiging 5. Kung kami ay gumamit ng purong diskarte A 2, ang aming kabayaran ay magiging 3/2 (tingnan ang Fig. 2). Katulad nito, kung paghaluin natin ang mga diskarte A 1 at A 2 sa magkaibang sukat, ang ating mga panalo ay magbabago sa isang tuwid na linya na dumadaan sa mga puntos na may mga coordinate (0, 5) at (1, 3/2), tawagin natin itong linya ng diskarte. B 2. Tulad ng sa nakaraang kaso, ang abscissa ng anumang punto sa linyang ito ay katumbas ng probabilidad kung saan ilalapat natin ang diskarte A 2, at ang ordinate ay ang resultang pakinabang, ngunit para lamang sa diskarte B 2 (tingnan ang Fig. 2).

Figure 2.
v at pinakamainam na dalas p 2 para sa manlalaro "A".

Sa isang tunay na laro, kapag ang isang makatwirang manlalaro na si "B" ay gumamit ng lahat ng kanyang mga diskarte, ang aming mga panalo ay magbabago sa putol na linya na ipinapakita sa Fig. 2 sa pula. Tinutukoy ng linyang ito ang tinatawag na mas mababang limitasyon ng mga panalo. Malinaw na ang pinaka mataas na punto ang putol na linyang ito ay tumutugma sa aming pinakamainam na diskarte. SA sa kasong ito, ito ang punto ng intersection ng mga linya ng mga diskarte B 1 at B 2. Pakitandaan na kung pipili ka ng dalas p 2 katumbas ng abscissa nito, kung gayon ang ating pakinabang ay mananatiling hindi nagbabago at pantay v para sa anumang diskarte ng player na "B", bilang karagdagan, ito ang magiging maximum na maaari naming garantiya sa aming sarili. Dalas (probability) p 2 , sa kasong ito, ay ang katumbas na dalas ng aming pinakamainam na pinaghalong diskarte. Sa pamamagitan ng paraan, mula sa Figure 2 maaari mong makita ang dalas p 1 , ang aming pinakamainam na pinaghalong diskarte, ay ang haba ng segment [ p 2 ; 1] sa x-axis. (Ito ay dahil p 1 + p 2 = 1 )

Gamit ang ganap na katulad na pangangatwiran, mahahanap natin ang mga frequency ng pinakamainam na diskarte para sa player na "B", na inilalarawan sa Figure 3.

Larawan 3.
Graphic na pagpapasiya ng presyo ng laro v at pinakamainam na dalas q 2 para sa manlalaro "SA".

Sa kanya lamang dapat ang tinatawag itaas na limitasyon natatalo(pulang putol na linya) at hanapin ang pinakamababang punto dito, dahil para sa manlalarong "B" ang layunin ay mabawasan ang pagkatalo. Parehong halaga ng dalas q 1 , ito ang haba ng segment [ q 2 ; 1] sa x-axis.

Nilalaman 1 Pangkalahatang Impormasyon 2 1.1 Mga Laro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Mga galaw. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 Istratehiya. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 Matrix na laro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 Punto ng landas. Mga dalisay na estratehiya 7 2.1 Mga halimbawa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Halimbawa 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Halimbawa 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 Pinaghalong estratehiya 9 3.1 Laro 2×2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1 Mga Halimbawa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Halimbawa 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Halimbawa 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.2 Geometric na interpretasyon. . . . . . . . . . . . . . . . . . . . 12 3.2 Mga Larong 2×n at m×2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Halimbawa 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1 1. Pangkalahatang impormasyon mula sa teorya ng laro 1.1. Mga Laro Ang teorya ng laro ay isang matematikal na teorya ng mga sitwasyon ng salungatan, i.e. mga sitwasyon kung saan ang mga interes ng dalawa o higit pang mga partido na nagtataguyod ng magkaibang mga layunin ay nagbabanggaan. Ang isang laro ay isang sitwasyon ng salungatan na kinokontrol ng ilang mga patakaran, na dapat ipahiwatig: mga posibleng pagpipilian para sa mga aksyon ng mga kalahok; ang dami ng resulta ng laro o pagbabayad (panalo, pagkatalo) kung saan humahantong ang isang naibigay na hanay ng mga galaw; ang dami ng impormasyon ng bawat panig tungkol sa pag-uugali ng iba. Ang larong pang-doble ay isang laro kung saan dalawang partido lamang (dalawang manlalaro) ang lalahok. Ang zero-sum paired na laro ay isang nakapares na laro kung saan ang kabuuan ng mga pagbabayad ay zero, i.e. Ang pagkawala ng isang manlalaro ay katumbas ng nakuha ng pangalawa. Depende sa saloobin ng bawat manlalaro sa halaga ng payoff function, ang mga ipinares na laro ay nahahati: Zero-sum paired game (antagonistic) - isang nakapares na laro kung saan ang halaga ng mga pagbabayad ay katumbas ng zero, i.e. Ang pagkawala ng isang manlalaro ay katumbas ng nakuha ng pangalawa. Ang isang non-antagonistic na laro ay isang nakapares na laro kung saan ang mga manlalaro ay humahabol ng iba't ibang layunin, ngunit hindi direktang kabaligtaran. 2 1.2. Moves Move - pagpili ng isa sa mga aksyon na itinakda ng mga panuntunan ng laro; pagpapatupad ng pagpipiliang ito. Ang mga galaw ay may dalawang uri: Personal na paglipat - + mulat na pagpili ng isa sa mga aksyon na ibinigay ng mga panuntunan ng laro + pagpapatupad ng pagpipiliang ito Random na paglipat - Ang isang random na paglipat ay isang pagpipilian mula sa isang bilang ng mga posibilidad, hindi natupad sa pamamagitan ng desisyon ng player, ngunit sa pamamagitan ng ilang mekanismo ng random na pagpili. Sa ibaba ay isinasaalang-alang namin ang zero-sum na ipinares na mga laro na naglalaman lamang ng mga personal na galaw. Ang bawat panig ay walang impormasyon tungkol sa pag-uugali ng iba. 3 1.3. Mga Istratehiya Ang diskarte ng manlalaro ay isang hanay ng mga panuntunan na tumutukoy sa pagpili ng mga aksyon para sa bawat personal na galaw ng manlalarong ito, depende sa sitwasyong lalabas sa panahon ng laro. Depende sa bilang ng mga posibleng diskarte, ang mga laro ay nahahati sa may hangganan at walang katapusan. Ang isang walang katapusang laro ay isang laro kung saan mayroon kahit isa sa mga manlalaro walang katapusang bilang estratehiya. Ang larong may hangganan ay isang laro kung saan ang bawat manlalaro ay may hangganan lamang na bilang ng mga diskarte. Tinutukoy ng bilang ng magkakasunod na galaw para sa sinumang manlalaro ang paghahati ng mga laro sa single-move at multi-move, o positional. + Sa isang one-turn na laro, ang bawat manlalaro ay gumagawa lamang ng isang pagpipilian mula sa mga posibleng opsyon at pagkatapos ay tinutukoy ang kinalabasan ng laro. + Ang larong multi-move, o positional, ay bubuo sa paglipas ng panahon, na kumakatawan sa isang serye sunud-sunod na yugto, ang bawat isa ay nangyayari pagkatapos ng paglipat ng isa sa mga manlalaro at ang kaukulang pagbabago sa sitwasyon. Sa isang one-turn na laro, ang bawat manlalaro ay gumagawa lamang ng isang pagpipilian mula sa posibleng mga opsyon at pagkatapos ay tinutukoy ang kinalabasan ng laro. Ang pinakamainam na diskarte ng isang manlalaro ay isang diskarte na, kapag ang laro ay paulit-ulit na maraming beses, ay nagbibigay sa player na ito ng maximum na posibleng average na panalo (o, kung ano ang pareho, ang pinakamababang posibleng average na pagkatalo). Sa teorya ng laro, ang lahat ng mga rekomendasyon ay ginawa batay sa pagpapalagay ng makatwirang pag-uugali ng mga manlalaro. Ang mga maling kalkulasyon at pagkakamali ng mga manlalaro, na hindi maiiwasan sa bawat sitwasyon ng salungatan, pati na rin ang mga elemento ng kaguluhan at panganib ay hindi isinasaalang-alang sa teorya ng laro. 4 1.4. Matrix game Ang matrix game ay isang one-move finite zero-sum game. Ang matrix game ay isang teoretikal modelo ng paglalaro sitwasyon ng salungatan kung saan ang mga kalaban, upang makamit ang mga layunin na magkasalungat sa diametrically, gumawa ng isang pagpipilian (lumipat) mula sa isang may hangganang numero mga posibleng paraan alinsunod sa mga napiling paraan ng pagkilos (mga diskarte), ang nakamit na resulta ay tinutukoy. Tingnan natin ang isang halimbawa. Hayaang mayroong dalawang manlalaro na A at B, kung saan maaaring pumili ang isa i-ika diskarte mula sa m ng mga posibleng istratehiya nito A1, A2, ...Am, at ang pangalawa ay pipili ng j-th na diskarte mula sa mga posibleng estratehiya nito B1, B2, ...Bm. Bilang resulta, ang unang manlalaro ay nanalo sa halagang aij, at ang pangalawang manlalaro ay nawalan ng halagang ito. Mula sa mga numerong aij, lumikha kami ng isang matrix   a11 a11 · · · a1n  a21 a22 · · · a2n    A = (aij) =  .. .. ..   . . . .  am1 am2 · · · amn Ang matrix A = (aij), i = 1, m, j = 1, n ay tinatawag na payoff matrix o m × n game matrix. Sa matrix na ito, ang mga hilera ay palaging para sa mga diskarte ng nanalong (pagmaximize) ng manlalaro A, iyon ay, ang manlalaro na nagsusumikap na i-maximize ang kanyang mga panalo. Ang mga column ay inilalaan para sa mga diskarte ng natalong manlalaro B, iyon ay, ang manlalaro na nagsusumikap na bawasan ang pamantayan ng kahusayan. Ang normalisasyon ng isang laro ay ang proseso ng pagbabawas ng isang positional na laro sa isang larong matrix. Ang isang laro sa normal na anyo ay isang positional na laro na binawasan sa isang larong matrix. Alalahanin natin na ang isang positional na multi-move na laro ay isang game-theoretic na modelo ng isang sitwasyon ng salungatan kung saan ang mga kalaban ay sunud-sunod na gumagawa ng isang pagpipilian (paglipat) mula sa isang tiyak na bilang ng mga posibleng kurso ng pagkilos sa bawat yugto ng pag-unlad ng sitwasyong ito. Ang solusyon ng laro ay ang paghahanap ng pinakamainam na diskarte ng parehong manlalaro at pagtukoy sa presyo ng laro. Ang presyo ng laro ay ang inaasahang pakinabang (pagkatalo) ng mga manlalaro. Ang solusyon sa laro ay matatagpuan sa alinman sa mga purong diskarte - kapag ang manlalaro ay dapat sumunod sa isang solong diskarte, o sa halo-halong mga diskarte, kapag ang manlalaro ay dapat gumamit ng dalawa o higit pang mga purong diskarte na may ilang mga probabilidad. Ang huli sa kasong ito ay tinatawag na aktibo. 5 Ang pinaghalong diskarte ng isang manlalaro ay isang vector, ang bawat bahagi nito ay nagpapakita ng dalas ng paggamit ng manlalaro ng kaukulang purong diskarte. Maximin o mas mababang presyo ng laro - numero α = max min aij i j Maximin diskarte (linya) - ang diskarte na pinili ng manlalaro upang i-maximize ang kanyang pinakamababang panalo. Malinaw, kapag pumipili ng pinakamaingat na diskarte sa maximin, binibigyan ng manlalaro A ang kanyang sarili (anuman ang pag-uugali ng kalaban) ng garantisadong kabayaran na hindi bababa sa α. Maximin o mataas na presyo ng laro - numero β = min max aij j i Minimax na diskarte (column) - ang diskarte na pinili ng manlalaro upang mabawasan ang kanyang pinakamataas na pagkatalo. Malinaw, kapag pumipili ng pinakamaingat na diskarte sa minimax, hindi pinapayagan ng player B, sa anumang sitwasyon, ang manlalaro A na manalo ng higit sa β. Ang mas mababang presyo ng laro ay palaging hindi lalampas sa pinakamataas na presyo ng laro α = max min aij 6 min max aij = β i j j i Theorem 1 (ang pangunahing theorem ng theory ng matrix games). Ang bawat may hangganang laro ay may kahit isang solusyon, posibleng nasa larangan ng magkahalong diskarte. 6 2. Mga larong may saddle point. Solusyon sa mga purong estratehiya Ang larong may saddle point ay isang laro kung saan α = max min aij = min max aij = β i j j i Para sa mga larong may saddle point, ang paghahanap ng solusyon ay binubuo sa pagpili ng maximin at minimax na mga diskarte na pinakamainam., Purong halaga ng laro - pangkalahatang kahulugan mababa at mataas na presyo ng laro α=β=ν 2.1. Mga Halimbawa Halimbawa 1 Maghanap ng solusyon sa mga purong estratehiya ng laro na ibinigay ng matrix   8 4 7 A= 6 5 9  7 7 8 Solusyon: tukuyin ang mataas at mababang presyo ng laro. Upang gawin ito, makikita namin ang pinakamababa sa mga numerong aij in i-ika linya αi = min aij j at ang maximum ng mga numero aij sa jth column βj = max aij i Isusulat namin ang mga numerong αi (row minima) sa tabi ng payment matrix sa kanan sa anyo ng karagdagang column. Isinulat namin ang mga numerong βi (column maxima) sa ilalim ng matrix sa anyo ng karagdagang linya: αi 8 4 7 4 6 5 9 5 7 7 8 7 βj 8 7 9 7 Hanapin ang maximum ng mga numero αi α = max αi = 7 i at ang minimum ng mga numero βj β = min βj = 7 j α = β - ang laro ay may saddle point. Ang pinakamainam na diskarte para sa manlalaro ay diskarte A3, at para sa manlalaro B ay diskarte B2, presyo ng netong laro ν = 7 Halimbawa 2 Ang payment matrix ay ibinibigay:   2 2 1 1 2  0 1 1 1 1  A=  1 1 1 1 2   1 2 1 1 2 Maghanap ng solusyon sa laro sa mga purong estratehiya. Solusyon: 2 2 1 1 2 1 0 1 1 1 1 0 1 1 1 1 2 1 1 2 1 1 2 1 βj 2 2 1 1 2 α = β = 1. Ang laro ay may anim na saddle point. Ang pinakamainam na estratehiya ay: A1 at B3 o B4 A3 at B3 o B4 A4 at B3 o B4 8 3. Solusyon ng laro sa magkahalong estratehiya Kapag α = β. Sa kaso kapag, kapag pumipili ng kanilang mga diskarte, ang parehong mga manlalaro ay walang impormasyon tungkol sa pagpili ng isa pa, ang laro ay may solusyon sa magkahalong diskarte. SA = (p1, p2, ..., pm) - pinaghalong diskarte ng player A, kung saan ang mga diskarte A1, A2, ..., Am ay inilapat na may mga probabilidad ∑ m p1, p2, ..., pm, pi = 1, pi > 0, i = 1, m i=1 SB = (q1, q2, ..., qn) - pinaghalong diskarte ng player B, kung saan inilalapat ang mga diskarte B1, B2, ..., Bm na may probabilities ∑ n q1, q2 , ..., qm , qi = 1, qi > 0, i = 1, n i=1 Kung: SA∗ ay ang pinakamainam na diskarte ng manlalaro A, ang SB∗ ay ang pinakamainam na diskarte ng manlalaro B, kung gayon ang ang halaga ng laro ay ∑ n ∑ m ν = aij · p∗i · qi∗ j=1 i=1 Ang sumusunod na theorem ay sumasagot sa tanong kung paano makahanap ng solusyon para sa mga laro 2 × 2, 2 × n, m × 2 Theorem 2 (kung paano makahanap ng solusyon para sa mga laro 2 × 2, 2 × n, m × 2). Kung ang isa sa mga manlalaro ay gumagamit ng pinakamainam na pinaghalong diskarte, kung gayon ang kanyang kabayaran ay katumbas ng halaga ng laro ν, anuman ang posibilidad na gagamitin ng pangalawang manlalaro ang mga diskarte na kasama sa pinakamainam (kabilang ang mga purong diskarte). 9 3.1. Laro 2 × 2 Isaalang-alang ang isang 2 × 2 na laro na may matrix: () a11 a21 a21 a22 Hayaan ang laro na walang solusyon sa mga purong estratehiya. Hanapin natin ang pinakamainam na estratehiya SA∗ at SB∗. Una, tinukoy namin ang diskarte SA∗ = (p∗1, p∗2). Ayon sa theorem, kung ang partido A ay sumunod sa diskarte ν, kung gayon anuman ang kurso ng pagkilos ng partido B, ang kabayaran ay mananatiling katumbas ng halaga ng paglalaro ng ν. Dahil dito, kung ang panig A ay sumusunod sa pinakamainam na diskarte SA∗ = (p∗1, p∗2), kung gayon ang panig B ay maaaring maglapat ng alinman sa mga estratehiya nito nang hindi binabago ang kabayaran nito. Pagkatapos, kapag gumamit ang manlalaro B ng purong diskarte B1 o B2, ang manlalaro ay makakatanggap ng average na kabayaran na katumbas ng halaga ng laro: a11 p∗1 + a21 p∗2 = ν ← para sa diskarte B1 a12 p∗1 + a22 p∗ 2 = ν ← para sa diskarte B2 Isinasaalang-alang na p∗1 + p∗2 = 1: p∗1 = a2 2−a2 1 a11 +a22 −a12 −a21 p∗2 = a1 1−a1 2 a11 +a2 −a12 −a21 Presyo ng laro: a22 a11 − a12 a21 ν= a11 + a22 − a12 − a21 Ang pinakamainam na diskarte ng manlalaro B ay matatagpuan sa parehong paraan: SB∗ = (q1∗ , q2∗). Isinasaalang-alang na q1∗ + q2∗ = 1: q1∗ = a2 2−a1 2 a11 +a22 −a12 −a21 q2∗ = a1 1−a2 1 a11 +a22 −a12 −a21 . Mga Halimbawa Halimbawa 3 Maghanap ng solusyon sa larong may matrix () −1 1 A= 1 −1 10 Solusyon: ang laro ay walang saddle point, dahil α= -1, β = 1, α ̸= β. Naghahanap kami ng solusyon sa magkahalong diskarte. Gamit ang mga formula para sa p∗ at q∗, nakukuha natin ang p∗1 = p∗2 = 0.5 at q1∗ = q2∗ = 0.5, ν = 0 Kaya, SA∗ = (0.5, 0.5) SB∗ = (0.5, 0.5 ) Halimbawa 4 Maghanap ng solusyon sa larong may matrix () 2 5 A= 6 4 Solusyon: ang laro ay walang saddle point, dahil α= 4, β = 5, α ̸= β. Naghahanap kami ng solusyon sa magkahalong diskarte. Gamit ang mga formula para sa p∗ at q∗, nakukuha natin ang p∗1 = 0.4, p∗2 = 0.6 at q1∗ = 0.2 q2∗ = 0.8, ν = 4.4 Kaya, SA∗ = (0.4, 0.6) SB∗ = ( 0.2, 0.8) 11 3.1.2. Geometric Interpretation Ang larong 2 × 2 ay maaaring bigyan ng simpleng geometric na interpretasyon. Kumuha tayo ng isang seksyon ng abscissa axis, ang bawat punto kung saan iniuugnay natin sa ilang pinaghalong diskarte S = (p1, p2) = (p1, 1 − p1) at ang posibilidad na p1 ng diskarte A1 ay magiging katumbas ng distansya mula sa ituro ang SA sa kanang dulo ng seksyon, at ang posibilidad p2 , diskarte A2 - ang distansya sa kaliwang dulo. .y .I .I I .B1′ .N .B1 .a21 .a11 .I I .I .∗ .x .P2 .SA∗ .P1∗ Sa partikular, ang kaliwang dulo ng seksyon (point with abscissa = 0) ay tumutugma sa diskarte A1, kanang dulo ng segment (x = 1) - diskarte A2 Sa mga dulo ng segment, dalawang patayo sa x-axis ang naibalik: axis I − I - ang kabayaran para sa diskarte A1 ay ipinagpaliban; axis II − II - ang kabayaran para sa diskarte A2 ay ipinagpaliban. Hayaang ilapat ng manlalaro B ang diskarte B1; nagbibigay ito sa mga palakol na I − I at II − II, ayon sa pagkakabanggit, ng mga puntos na may mga ordinate a11 at a21. Gumuhit kami ng isang tuwid na linya B1 − B1′ sa pamamagitan ng mga puntong ito. Para sa anumang pinaghalong diskarte SA = (p1, p2), ang kabayaran ng manlalaro ay tinutukoy ng punto N sa tuwid na linya B1 − B1′, na tumutugma sa point SA sa x-axis na naghahati sa segment sa ratio na p2: p1. Malinaw, ang tuwid na linya B2 − B2′, na tumutukoy sa kabayaran para sa diskarte B2, ay maaaring gawin sa eksaktong parehong paraan. 12 .y .I .I I .B2 .N .a21 .B2′ a . 22 .I I .I .∗ .x .P2 .SA∗ .P1∗ Ito ay kinakailangan upang mahanap ang pinakamainam na diskarte SA∗ , i.e. na ang pinakamababang kabayaran ng player A (na binigyan ng pinakamasamang pag-uugali para sa kanya ng player B) ay magiging maximum. Para magawa ito, bumuo ng lower bound para sa kabayaran ng player A para sa mga diskarte B1, B2, i.e. putol na linya B1 N B2′ ;. Sa hangganang ito makikita ang pinakamababang kabayaran ng manlalaro A para sa alinman sa kanyang magkahalong diskarte, punto N, kung saan ang kabayarang ito ay umabot sa maximum at tinutukoy ang desisyon at presyo ng laro. .y .I .I I .B2 .B1′ .N .B1 .B2′ .I I .I .∗ .x .P2 . A∗ S . 1∗ P Ang ordinate ng point N ay hindi hihigit sa halaga ng larong ν, ang abscissa nito ay katumbas ng ∗2, at ang distansya sa kanang dulo ng segment ay katumbas ng ∗1, i.e. ang distansya mula sa point SA∗ hanggang sa mga dulo ng segment ay katumbas ng probabilities ∗2 at ∗1 ng mga diskarte A2 at A1 ng pinakamainam na pinaghalong diskarte ng player A. sa kasong ito, ang solusyon sa laro ay tinutukoy ng intersection punto ng mga estratehiya B1 at B2. Nasa ibaba ang isang kaso kung saan ang pinakamainam na diskarte ng manlalaro ay purong diskarte A2. Dito ang diskarte A2 (para sa anumang diskarte ng kaaway) ay mas kumikita kaysa sa diskarte A1, 13 .y .y .I .I I .I I. I .B2′ . 1′ B .B1′ B . 2 .B2′ B . 2 .B1 .ν = a21 .B1 .ν = a21 I. I I. I .I . .x .ako . .x. 2∗ P . A∗S = A2. 2∗ P . A∗ S = A2 Sa kanan ay ipinapakita ang kaso kapag ang manlalaro B ay may halatang hindi kumikitang diskarte. Ang geometric na interpretasyon ay ginagawang posible na mailarawan ang mas mababang presyo ng larong α at ang mataas na presyo β .y .I .I I .B2 .B1′ .N .B1 . B2′ .β = a21 .α = a22 .I I .I .∗ .x .P2 . A∗ S . 1∗ P Sa parehong graph, maaari din tayong magbigay ng geometric na interpretasyon ng pinakamainam na estratehiya ng manlalaro B. Madaling i-verify na ang bahagi q1∗ ng diskarte B1 ng pinakamainam na pinaghalong diskarte SB∗ = (q1∗ , q2∗) ay katumbas ng ratio ng haba ng segment na KB2 sa kabuuan ng mga haba ng mga segment na KB1 at KB2 sa I − I axis: .y .I .I I .B2 . B1′ .N .K .L .B1 .B2′ .I I .I .∗ .x .P2 . A∗ S . 1∗ P 14 KB2 q1∗ = KB2 + KB1 o LB2′ q1∗ = LB2′ + LB1′ Ang pinakamainam na diskarte SB∗ = (q1∗ , q2∗) ay matatagpuan sa ibang paraan, kung magpapalitan tayo ng mga manlalarong B at B, at sa halip ang maximum ng mas mababang limitasyon ng mga panalo, isaalang-alang ang minimum ng pinakamataas na limitasyon. .y .I .I I .A2 .A′1 .N .A1 .A′2 .I I .I . .x .q2∗ . B∗ S .q1∗ 15 3.2. 2 × n at m × 2 laro Ang solusyon sa 2 × n at m × 2 laro ay batay sa sumusunod na teorama. Theorem 3. Ang anumang may hangganang laro m × n ay may solusyon kung saan ang bilang ng mga aktibong estratehiya ng bawat panig ay hindi lalampas sa pinakamaliit sa mga numerong m at n. Ayon sa theorem na ito, ang isang 2 × n na laro ay palaging may solusyon kung saan ang bawat manlalaro ay may hindi hihigit sa dalawang aktibong diskarte. Kapag nahanap mo na ang mga diskarteng ito, ang 2 × n game ay magiging isang 2 × 2 na laro, na maaaring lutasin sa elementarya na paraan. Ang paghahanap ng mga aktibong estratehiya ay maaaring gawin sa graphical na paraan: 1) isang graphical na interpretasyon ay binuo; 2) ang mas mababang limitasyon ng mga panalo ay tinutukoy; 3) dalawang mga diskarte ng pangalawang manlalaro ay nakilala sa mas mababang limitasyon ng kabayaran, na tumutugma sa dalawang linya na nagsa-intersecting sa punto na may pinakamataas na ordinate (kung higit sa dalawang linya ang nagsalubong sa puntong ito, ang anumang pares ay kinuha) - ang mga diskarteng ito kumakatawan sa mga aktibong estratehiya ng manlalaro B. Kaya , ang laro 2 × n ay nabawasan sa larong 2 × 2. Ang larong m × 2 ay maaari ding malutas, na may pagkakaiba na hindi ang mas mababa, ngunit ang itaas na hangganan ng kabayaran ay constructed, at hindi ang maximum, ngunit ang minimum ay hinahangad dito. Halimbawa 5 Maghanap ng solusyon sa laro () 7 9 8 A= 10 6 9 Solusyon: gamit ang geometric na pamamaraan, pipili tayo ng mga aktibong estratehiya. Ang mga direktang linya B1 − B1′, B2 − B2′ at B3 − B3′ ay tumutugma sa mga estratehiya B1, B2, B3. Ang sirang linya B1 N B2 ay ang mas mababang limitasyon ng mga panalo ng manlalaro. Ang laro ay may solusyon S∗A = (23, 31); S∗B = (0.5; 0.5; 0); v = 8. 16 .y .I .I I . 1′ B B . 2 .B3′ .N .B3 .B1 .B2′ .I I .I . .x. 2∗ P . A∗ S . 1∗ P 17 Index game, 2 galaw, 3 2 × 2, 10 personal, 3 2 × 2, 9 random, 3 geometry, 12 net na presyo ng laro, 7 halimbawa, 10 2 × n, 9, 16 m × 2, 9 , 16 infinite, 4 sa normal na anyo, 5 finite, 4 multi-move, 4 one-move, 4 matrix, 5 paired, 2 zero-sum, 2 antagonistic, 2 non-antagonistic, 2 solution, 5 sa mixed strategies, 5 . pinakamainam, 4 halo-halong, 5 teorya ng laro, 2 18

Mula sa sikat na American blog na Cracked.

Ang teorya ng laro ay tungkol sa pag-aaral ng mga paraan upang gawin ang pinakamahusay na hakbang at, bilang resulta, makuha ang pinakamaraming panalong pie hangga't maaari sa pamamagitan ng pagputol ng ilan sa mga ito mula sa ibang mga manlalaro. Ito ay nagtuturo sa iyo na pag-aralan ang maraming mga kadahilanan at gumawa ng lohikal na balanseng konklusyon. Sa tingin ko dapat itong pag-aralan pagkatapos ng mga numero at bago ang alpabeto. Dahil lang sa napakaraming tao ang gumagawa ng mahahalagang desisyon batay sa intuwisyon, lihim na propesiya, lokasyon ng mga bituin at iba pa. Lubusan kong pinag-aralan ang teorya ng laro, at ngayon gusto kong sabihin sa iyo ang tungkol sa mga pangunahing kaalaman nito. Marahil ito ay magdaragdag ng ilang sentido komun sa iyong buhay.

1. Dilemma ng bilanggo

Inaresto sina Berto at Robert dahil sa pagnanakaw sa bangko matapos mabigong magamit ng maayos ang isang ninakaw na sasakyan para makatakas. Hindi mapapatunayan ng mga pulis na sila ang nagnakaw sa bangko, pero nahuli nila silang nakasakay sa isang ninakaw na kotse. Dinala sila sa iba't ibang silid at bawat isa ay inalok ng deal: ibigay ang isang kasabwat at ipadala siya sa bilangguan sa loob ng 10 taon, at palayain ang kanyang sarili. Ngunit kung pareho silang magkakanulo sa isa't isa, ang bawat isa ay tatanggap ng 7 taon. Kung walang magsasabi, pareho silang makukulong ng 2 taon para lang sa pagnanakaw ng sasakyan.

Lumalabas na kung mananatiling tahimik si Berto, ngunit pinabayaan siya ni Robert, makukulong si Berto sa loob ng 10 taon, at malaya si Robert.

Ang bawat bilanggo ay isang manlalaro, at ang pakinabang ng bawat isa ay maaaring ipahayag bilang isang "pormula" (kung ano ang kanilang parehong nakukuha, kung ano ang iba pa). Halimbawa, kung tatamaan kita, ang aking winning pattern ay magiging ganito (I get a rude victory, you suffer from matinding sakit). Dahil ang bawat bilanggo ay may dalawang pagpipilian, maaari naming ipakita ang mga resulta sa isang talahanayan.

Praktikal na Aplikasyon: Pagkilala sa mga Sociopath

Dito makikita natin ang pangunahing aplikasyon ng teorya ng laro: pagkilala sa mga sociopath na iniisip lamang ang tungkol sa kanilang sarili. Ang tunay na teorya ng laro ay isang makapangyarihang tool sa pagsusuri, at ang amateurism ay kadalasang nagsisilbing pulang bandila na nagpapa-flag sa isang taong walang pakiramdam ng karangalan. Ang mga taong gumagawa ng intuitive na kalkulasyon ay naniniwala na mas mabuting gumawa ng isang bagay na pangit dahil magreresulta ito sa isang mas maikling sentensiya ng pagkakulong anuman ang gawin ng ibang manlalaro. Sa teknikal, ito ay tama, ngunit kung ikaw ay isang taong maikli ang paningin na naglalagay ng mga numero nang mas mataas buhay ng tao. Ito ang dahilan kung bakit ang teorya ng laro ay napakapopular sa pananalapi.

Ang totoong problema sa dilemma ng bilanggo ay hindi nito pinapansin ang data. Halimbawa, hindi nito isinasaalang-alang ang posibilidad na makipagkita ka sa mga kaibigan, kamag-anak, o kahit na mga pinagkakautangan ng taong ipinadala mo sa bilangguan sa loob ng 10 taon.

Ang pinakamasamang bahagi ay ang lahat ng sangkot sa dilemma ng bilanggo ay kumikilos na parang hindi pa nila ito narinig.

At ang pinakamahusay na hakbang ay ang manatiling tahimik, at pagkatapos ng dalawang taon, kasama ang isang mabuting kaibigan, gumamit ng parehong pera.

2. Dominant na diskarte

Ito ay isang sitwasyon kung saan nagbibigay ang iyong mga aksyon pinakamalaking panalo, anuman ang kilos ng kalaban. Anuman ang mangyari, ginawa mo ang lahat ng tama. Ito ang dahilan kung bakit naniniwala ang maraming tao na may Prisoner's Dilemma na ang pagkakanulo ay humahantong sa "pinakamahusay" na kahihinatnan anuman ang ginagawa ng ibang tao, at ang kamangmangan sa katotohanang likas sa pamamaraang ito ay nagmumukhang napakadali.

Karamihan sa mga larong nilalaro namin ay walang mahigpit na nangingibabaw na mga diskarte dahil kung hindi ay kakila-kilabot ang mga ito. Isipin kung palagi mong ginagawa ang parehong bagay. Walang dominanteng diskarte sa larong rock-paper-gunting. Ngunit kung nakikipaglaro ka sa isang taong may oven mitts at maaari lamang magpakita ng bato o papel, magkakaroon ka ng isang nangingibabaw na diskarte: papel. Ibabalot ng papel mo ang kanyang bato o magreresulta sa isang draw, at hindi ka matatalo dahil hindi makapagpapakita ng gunting ang iyong kalaban. Ngayon na mayroon ka nang dominanteng diskarte, magiging tanga ka na sumubok ng ibang bagay.

3. Labanan ng mga kasarian

Mas kawili-wili ang mga laro kapag wala silang mahigpit na nangingibabaw na diskarte. Halimbawa, ang labanan ng mga kasarian. Si Anjali at Borislav ay nagde-date, ngunit hindi makakapili sa pagitan ng ballet at boxing. Gustung-gusto ni Anjali ang boksing dahil natutuwa siyang makita ang pag-agos ng dugo sa tuwa ng sumisigaw na pulutong ng mga manonood na nag-iisip na sila ay sibilisado dahil lamang sa binayaran nila ang ulo ng isang tao upang basagin.

Gusto ni Borislav na manood ng balete dahil naiintindihan niya ang pinagdadaanan ng mga ballerina malaking halaga mga pinsala at ang pinakamahirap na pagsasanay, alam na ang isang pinsala ay maaaring wakasan ang lahat. Mga mananayaw ng ballet - pinakamahusay na mga atleta nasa lupa. Maaaring sipain ka ng isang ballerina sa ulo, ngunit hinding-hindi niya ito gagawin, dahil ang kanyang binti ay mas mahalaga kaysa sa iyong mukha.

Bawat isa sa kanila ay gustong pumunta sa kanilang paboritong event, ngunit ayaw nilang mag-enjoy dito nang mag-isa, kaya narito kung paano sila mananalo: pinakamataas na halaga- gawin ang gusto nila, pinakamaliit na halaga- kasama lang ang ibang tao, at zero - mag-isa.

Ang ilang mga tao ay nagmumungkahi ng matigas ang ulo brinksmanship: kung gagawin mo ang gusto mo kahit na ano, ang ibang tao ay dapat sumunod sa iyong pinili o mawala ang lahat. Gaya ng sinabi ko na, Ang pinasimpleng teorya ng laro ay mahusay sa pagtukoy ng mga tanga.

Praktikal na aplikasyon: Iwasan ang matutulis na sulok

Siyempre, ang diskarte na ito ay mayroon ding mga makabuluhang disbentaha. Una sa lahat, kung ituturing mo ang iyong pakikipag-date bilang isang "labanan ng mga kasarian", hindi ito gagana. Maghiwalay na kayo para mahanap ng bawat isa sa inyo ang magugustuhan nila. At ang pangalawang problema ay na sa ganitong sitwasyon ang mga kalahok ay hindi sigurado sa kanilang sarili na hindi nila magagawa ito.

Ang tunay na panalong diskarte para sa lahat ay gawin ang gusto nila. at pagkatapos, o sa susunod na araw, kapag sila ay libre, pumunta sa isang cafe magkasama. O kahalili sa pagitan ng boxing at ballet hanggang sa magkaroon ng rebolusyon sa entertainment world at maimbento ang boxing ballet.

4. Nash ekwilibriyo

Ang Nash equilibrium ay isang hanay ng mga galaw kung saan walang gustong gumawa ng anumang bagay na naiiba pagkatapos ng katotohanan. At kung magagawa natin ito, papalitan ng teorya ng laro ang buong sistemang pilosopikal, relihiyon, at pananalapi sa planeta, dahil ang "hindi masisira" ay naging mas makapangyarihan para sa sangkatauhan puwersang nagtutulak kaysa sa apoy.

Mabilis nating hatiin ang $100. Ikaw at ako ang magpapasya kung ilan sa daan-daang kailangan namin at sabay na iaanunsyo ang mga halaga. Kung ang ating kabuuang halaga wala pang isang daan, nakukuha ng lahat ang gusto nila. Kung kabuuan higit sa isang daan, ang humiling ng pinakamaliit na halaga ay nakakakuha ng nais na halaga, at ang taong sakim ay nakakakuha ng natitira. Kung hihingi kami ng parehong halaga, lahat ay makakakuha ng $50. Magkano ang itatanong mo? Paano mo hahatiin ang pera? Mayroon lamang isang panalong galaw.

Makukuha ka ng pag-claim ng $51 maximum na halaga anuman ang piliin ng iyong kalaban. Kung humingi siya ng higit pa, makakatanggap ka ng $51. Kung humingi siya ng $50 o $51, makakatanggap ka ng $50. At kung hihingi siya ng mas mababa sa $50, makakatanggap ka ng $51. Sa alinmang paraan, walang ibang opsyon na gagawa ka ng mas maraming pera kaysa sa isang ito. Nash equilibrium - isang sitwasyon kung saan pareho kaming pumili ng $51.

Praktikal na Paglalapat: Mag-isip muna

Ito ang buong punto ng teorya ng laro. Hindi mo kailangang manalo, lalong hindi makapinsala sa ibang mga manlalaro, ngunit kailangan mong gawin ang pinakamahusay na hakbang para sa iyong sarili, anuman ang inilaan ng mga nasa paligid mo para sa iyo. At mas mabuti kung ang hakbang na ito ay kapaki-pakinabang para sa iba pang mga manlalaro. Ito ang uri ng matematika na maaaring magbago ng lipunan.

Ang isang kawili-wiling pagkakaiba-iba ng ideyang ito ay ang pag-inom, na maaaring tawaging Nash Equilibrium na umaasa sa oras. Kapag uminom ka ng sapat, wala kang pakialam sa mga kilos ng ibang tao kahit ano pa ang kanilang gawin, ngunit sa susunod na araw ay talagang nagsisisi ka na hindi mo ginawa ang ibang bagay.

5. Ihagis ang laro

Ang toss ay nilalaro sa pagitan ng Manlalaro 1 at Manlalaro 2. Ang bawat manlalaro ay sabay-sabay na pumipili ng mga ulo o buntot. Kung tama ang hula nila, makukuha ng Manlalaro 1 ang sentimos ng Manlalaro 2. Kung hindi, ang Manlalaro 2 ay makakakuha ng barya ng Manlalaro 1.

Simple lang ang winning matrix...

...pinakamainam na diskarte: ganap na maglaro nang random. Ito ay mas mahirap kaysa sa iyong iniisip dahil ang pagpili ay dapat na ganap na random. Kung mayroon kang kagustuhan sa ulo o buntot, magagamit ito ng iyong kalaban para kunin ang iyong pera.

Siyempre, ang tunay na problema dito ay mas mabuti kung maghagis na lang sila ng isang sentimo sa isa't isa. Bilang isang resulta, ang kanilang mga kita ay magiging pareho, at ang resulta ng trauma ay maaaring makatulong sa mga kapus-palad na mga taong ito na makaramdam ng isang bagay maliban sa kakila-kilabot na pagkabagot. Pagkatapos ng lahat, ito pinakamasamang laro kailanman umiiral. At ito ang perpektong modelo para sa isang penalty shootout.

Praktikal na aplikasyon: Parusa

Sa football, hockey at marami pang ibang laro, ang dagdag na oras ay isang penalty shootout. At sila ay magiging mas kawili-wili kung sila ay batay sa kung gaano karaming beses ang mga manlalaro buong anyo ay makakagawa ng cartwheel dahil ito man lang ay indikasyon ng kanilang pisikal na kakayahan at magiging masaya itong panoorin. Ang mga goalkeeper ay hindi malinaw na matukoy ang paggalaw ng isang bola o pak sa pinakadulo simula ng paggalaw nito, dahil, sa kasamaang-palad, ang mga robot ay hindi pa rin lumalahok sa aming mga kumpetisyon sa palakasan. Dapat piliin ng goalkeeper ang kaliwa o kanang direksyon at umaasa na ang kanyang pinili ay tumutugma sa pagpili ng kalaban na bumaril sa layunin. Ito ay may pagkakatulad sa paglalaro ng mga barya.

Gayunpaman, tandaan na ito ay hindi isang perpektong halimbawa ng pagkakatulad sa laro ng mga ulo at buntot, dahil kahit na paggawa ng tamang pagpili direksyon, maaaring hindi mahuli ng goalkeeper ang bola, at maaaring hindi matamaan ng attacker ang goal.

Kaya ano ang aming konklusyon ayon sa teorya ng laro? Ang mga laro ng bola ay dapat magtapos sa paraang "multi-ball", kung saan bawat minuto ay binibigyan ng dagdag na bola/pak ang bawat minutong isa-isang manlalaro hanggang sa makamit ng isang panig ang isang tiyak na resulta, na isang indikasyon ng tunay na kasanayan ng mga manlalaro, at hindi isang kamangha-manghang random na pagkakataon.

Sa pagtatapos ng araw, dapat gamitin ang teorya ng laro upang gawing mas matalino ang laro. Ibig sabihin ay mas mabuti.

Teorya ng laro bilang isang sangay ng pagsasaliksik ng operasyon, ito ay ang teorya ng mga modelong matematikal para sa paggawa ng pinakamainam na mga desisyon sa ilalim ng mga kondisyon ng kawalan ng katiyakan o salungatan ng ilang partido na may iba't ibang interes. Pinag-aaralan ng teorya ng laro ang mga pinakamainam na estratehiya sa mga sitwasyon sa paglalaro. Kabilang dito ang mga sitwasyon na may kaugnayan sa pagpili ng mga pinaka-pinakinabangang mga solusyon sa produksyon para sa isang sistema ng pang-agham at pang-ekonomiyang mga eksperimento, ang organisasyon kontrol sa istatistika, mga ugnayang pang-ekonomiya sa pagitan ng mga industriyal na negosyo at iba pang sektor. Pagpormal mga sitwasyon ng salungatan sa matematika, maaari silang ilarawan bilang isang laro ng dalawa, tatlo, atbp. mga manlalaro, na ang bawat isa ay nagsusumikap sa layunin na i-maximize ang kanilang benepisyo, ang kanilang mga panalo sa kapinsalaan ng isa.

Ang seksyong "Teorya ng Laro" ay kinakatawan ng tatlo mga online na calculator:

  1. Pinakamainam na diskarte ng mga manlalaro. Sa ganitong mga problema, tinukoy ang isang payment matrix. Kinakailangang maghanap ng dalisay o halo-halong diskarte ng mga manlalaro at, presyo ng laro. Upang malutas, dapat mong tukuyin ang dimensyon ng matrix at ang paraan ng solusyon. Ang serbisyo ay nagpapatupad sumusunod na pamamaraan mga solusyon sa isang larong may dalawang manlalaro:
    1. Minimax. Kung kailangan mong hanapin ang purong diskarte ng mga manlalaro o sagutin ang isang tanong tungkol sa saddle point ng isang laro, piliin ang paraan ng solusyon na ito.
    2. Simplex na pamamaraan. Ginagamit upang malutas ang magkahalong diskarte sa mga laro gamit ang mga pamamaraan ng linear programming.
    3. Paraan ng graphic. Ginagamit upang malutas ang magkahalong diskarte sa mga laro. Kung mayroong isang saddle point, ang solusyon ay hihinto. Halimbawa: Para sa isang ibinigay na matrix ng pagbabayad, hanapin ang pinakamainam na pinaghalong diskarte ng mga manlalaro at ang presyo ng larong ginagamit graphic na pamamaraan mga solusyon sa laro.
    4. Brown-Robinson na umuulit na pamamaraan. Ginagamit ang iterative method kapag hindi naaangkop ang graphical na paraan at kapag ang algebraic at mga pamamaraan ng matrix. Ang pamamaraang ito ay nagbibigay ng tinatayang halaga ng presyo ng laro, at ang tunay na halaga ay maaaring makuha sa anumang nais na antas ng katumpakan. Ang paraang ito ay hindi sapat para sa paghahanap ng pinakamainam na mga diskarte, ngunit ito ay nagbibigay-daan sa iyong subaybayan ang dinamika ng isang turn-based na laro at matukoy ang halaga ng laro para sa bawat manlalaro sa bawat hakbang.
    Halimbawa, ang gawain ay maaaring parang "ipahiwatig ang pinakamainam na diskarte ng mga manlalaro para sa laro na ibinigay ng payoff matrix".
    Gumagamit ang lahat ng pamamaraan ng tseke para sa mga nangingibabaw na row at column.
  2. Larong Bimatrix. Karaniwan sa naturang laro ay tinutukoy ang dalawang matrice ng parehong laki ng mga kabayaran ng una at pangalawang manlalaro. Ang mga hilera ng mga matrice na ito ay tumutugma sa mga diskarte ng unang manlalaro, at ang mga hanay ng mga matrice ay tumutugma sa mga diskarte ng pangalawang manlalaro. Sa kasong ito, ang unang matrix ay kumakatawan sa mga panalo ng unang manlalaro, at ang pangalawang matrix ay kumakatawan sa mga panalo ng pangalawa.
  3. Mga larong may kalikasan. Ginagamit kapag kailangan mong pumili desisyon ng pamamahala ayon sa pamantayan ng Maximax, Bayes, Laplace, Wald, Savage, Hurwitz.
    Para sa pamantayan ng Bayes, kakailanganin ding ilagay ang mga probabilidad ng mga kaganapang nagaganap. Kung hindi tinukoy ang mga ito, iwanan ang mga default na halaga (magkakaroon ng mga katumbas na kaganapan).
    Para sa pamantayan ng Hurwitz, ipahiwatig ang antas ng optimismo λ. Kung ang parameter na ito ay hindi tinukoy sa mga kundisyon, maaari mong gamitin ang mga halaga 0, 0.5 at 1.

Maraming problema ang nangangailangan ng paghahanap ng mga solusyon gamit ang mga computer. Ang mga serbisyo at function sa itaas ay isa sa mga tool.



Bago sa site

>

Pinaka sikat