Mājas Profilakse Matemātiskās spēles teorija. Spēļu ierakstīšanas un risināšanas piemēri no dzīves

Matemātiskās spēles teorija. Spēļu ierakstīšanas un risināšanas piemēri no dzīves

Ja ir vairākas konfliktējošās puses (personas), no kurām katra pieņem noteiktu lēmumu, ko nosaka noteikts noteikumu kopums, un katrai no personām ir zināms konfliktsituācijas galīgais stāvoklis ar katrai no pusēm iepriekš noteiktiem maksājumiem, tad spēle teikts, ka tas notiks.

Spēles teorijas uzdevums ir izvēlēties konkrēta spēlētāja uzvedības līniju, no kuras novirze var tikai samazināt viņa laimestu.

Dažas spēles definīcijas

Spēles rezultātu kvantitatīvo novērtējumu sauc par samaksu.

Dubults (divas personas) sauc par nulles summas spēli, ja maksājumu summa ir nulle, t.i. ja viena spēlētāja zaudējums ir vienāds ar otra ieguvumu.

Tiek saukts nepārprotams spēlētāja izvēles apraksts katrā no iespējamām situācijām, kurās viņam jāveic personisks gājiens. spēlētāja stratēģija .

Spēlētāja stratēģiju sauc par optimālo, ja, spēlei atkārtojot vairākas reizes, tā sniedz spēlētājam maksimāli iespējamo vidējie laimesti(vai, kas ir tas pats, minimālais iespējamais vidējais laimests).

Spēle, ko nosaka matrica A kam m līnijas un n kolonnu sauc par ierobežotu dimensiju pāru spēli m* n;

Kur i=
- pirmā spēlētāja stratēģija ar mstrategiju; j=- otrā spēlētāja stratēģija, kurai ir n stratēģijas; ij– pirmā spēlētāja laimests i-stratēģija, ja to izmanto otrais j stratēģija (vai, kas ir tas pats, otrās zaudējums tajā j-th stratēģija, ja to izmanto vispirms i th);

A =  ij– spēles maksājumu matrica.

1.1. Spēlēšana ar tīrām stratēģijām

Zema spēles cena (pirmajam spēlētājam)

= maks (min ij). (1.2)

i j

Labākā spēles cena (otram spēlētājam):

= min (maks ij) . (1.3)

i

Ja = , spēli sauc par seglu punktu spēli (1.4) vai spēli ar tīrām stratēģijām. Kurā V = = sauc par vērtīgu spēli ( V- spēles cena).

Piemērs. Ir dota 2 personu spēles A maksājumu matrica Nosakiet optimālas stratēģijas katram spēlētājam un spēles cena:

(1.4)

maks 10 9 12 6

i

min 6

j

- pirmā spēlētāja stratēģija (rinda).

Otrā spēlētāja stratēģija (kolonnas).

- spēles cena.

Tādējādi spēlei ir seglu punkts. stratēģija j = 4 – optimāla stratēģija otrajam spēlētājam i=2 - pirmajam. Mums ir spēle ar tīrām stratēģijām.

1.2 Spēles ar jauktām stratēģijām

Ja maksājumu matricai nav seglu punkta, t.i.
, un neviens spēles dalībnieks nevar izvēlēties vienu plānu kā savu optimālo stratēģiju, spēlētāji pāriet uz “jauktām stratēģijām”. Turklāt katrs spēlētājs spēles laikā izmanto katru savu stratēģiju vairākas reizes.

Vektoru, kura katrs komponents parāda relatīvo biežumu, kad spēlētājs izmanto atbilstošo tīro stratēģiju, tiek saukts par šī spēlētāja jaukto stratēģiju.

X= (X 1 …X i …X m) – pirmā spēlētāja jaukta stratēģija.

U= (plkst 1 ...y j ...y n) – otrā spēlētāja jaukta stratēģija.

xi , g j– relatīvās biežums (varbūtības), kad spēlētāji izmanto savas stratēģijas.

Jaukto stratēģiju izmantošanas nosacījumi

. (1.5)

Ja X* = (X 1 * ….X es*… X m*) – pirmā spēlētāja izvēlēta optimālā stratēģija; Y* = (plkst 1 * …plkst j*... plkst n*) ir otrā spēlētāja izvēlētā optimālā stratēģija, tad skaitlis ir spēles izmaksas.

(1.6)

Lai numuru V bija spēles cena, un X* Un plkst* - optimālas stratēģijas, tas ir nepieciešams un pietiekams, lai apmierinātu nevienlīdzības

(1.7)

Ja kāds no spēlētājiem izmanto optimālo jaukto stratēģiju, tad viņa izmaksa ir vienāda ar spēles izmaksām V neatkarīgi no tā, cik bieži otrais spēlētājs izmantos optimālajā iekļautās stratēģijas, ieskaitot tīrās stratēģijas.

Spēļu teorijas problēmu samazināšana līdz lineārās programmēšanas problēmām.

Piemērs. Atrodiet risinājumu spēlei, ko nosaka izmaksu matrica A.

A = (1.8)

y 1 y 2 y 3

Risinājums:

Izveidosim lineārās programmēšanas uzdevumu dubultpāri.

Pirmajam spēlētājam

(1.9)

plkst 1 +plkst 2 +plkst 3 = 1 (1.10)

Atbrīvojot sevi no mainīgā V(spēles cena), sadaliet izteiksmju (1.9), (1.10) kreiso un labo pusi V. Pieņemot plkst j /V jaunam mainīgajam z i, saņemam jauna sistēma ierobežojumi (1.11) un mērķa funkcija (1.12)

(1.11)

. (1.12)

Līdzīgi mēs iegūstam spēles modeli otrajam spēlētājam:

(1.13)

X 1 +X 2 +X 3 = 1 . (1.14)

Modeļa (1.13), (1.14) reducēšana uz formu bez mainīgā V, saņemam

(1.15)

, (1.16)

Kur
.

Ja mums ir jānosaka pirmā spēlētāja uzvedības stratēģija, t.i. relatīvais viņa stratēģiju izmantošanas biežums ( X 1 ….X i …X m), izmantosim otro atskaņotāja modeli, jo šie mainīgie ir viņa izmaksu modelī (1.13), (1.14).

Samazināsim (1.15), (1.16) līdz kanoniskajai formai

(1.17)

Paziņojums! Jūsu konkrētās problēmas risinājums izskatīsies līdzīgs šim piemēram, iekļaujot visas tabulas, skaidrojošos tekstus un attēlus, kas parādīti zemāk, bet ņemot vērā jūsu sākotnējos datus...

Uzdevums:
Matricas spēli nodrošina šāda izmaksu matrica:

Stratēģijas "B"
Stratēģijas "A" B 1B 2
A 1 3 5
A 2 6
3
2

Atrodiet matricas spēles risinājumu, proti:
- atrodiet spēles augstāko cenu;
- zemāka cena spēles;
- spēles neto cena;
- norāda spēlētāju optimālās stratēģijas;
- atnest grafiskais risinājums(ģeometriskā interpretācija), ja nepieciešams.

1. darbība

Noteiksim spēles zemāko cenu - α

Zemākā spēles cenaα ir maksimālā uzvara, ko varam sev garantēt spēlē pret saprātīgu pretinieku, ja visas spēles garumā izmantojam vienu un tikai vienu stratēģiju (šo stratēģiju sauc par “tīro”).

Ļaujiet mums atrast katrā maksājumu matricas rindā minimums elementu un ierakstiet to papildu kolonnā (Atlasīts dzeltens skatīt 1. tabulu).

Tad atradīsim maksimums papildu kolonnas elements (atzīmēts ar zvaigznīti), tā būs spēles zemākā cena.

1. tabula

Stratēģijas "B"
Stratēģijas "A" B 1B 2 Rindas minimums
A 1 3 5 3 *
A 2 6
3
2
3
2

Mūsu gadījumā spēles zemākā cena ir: α = 3, un lai garantētu uzvaru, kas nav sliktāka par 3, mums jāpieturas pie stratēģijas A 1

solis: 2

Noteiksim spēles augšējo cenu - β

Augstākā spēles cenaβ ir minimālais zaudējums, ko spēlētājs B var sev garantēt spēlē pret saprātīgu pretinieku, ja viņš visā spēlē izmanto vienu un tikai vienu stratēģiju.

Ļaujiet mums atrast katrā maksājumu matricas kolonnā maksimums elementu un ierakstiet to papildu rindiņā zemāk (izcelts dzeltenā krāsā, sk. 2. tabulu).

Tad atradīsim minimums papildu rindas elements (atzīmēts ar plusu), tā būs spēles augšējā cena.

2. tabula

Stratēģijas "B"
Stratēģijas "A" B 1B 2 Rindas minimums
A 1 3 5 3 *
A 2 6
3
2

Mūsu gadījumā spēles augstākā cena ir: β = 5, un, lai garantētu zaudējumu, kas nav sliktāks par 5, pretiniekam (spēlētājam “B”) ir jāievēro stratēģija B 2

solis: 3
Salīdzināsim spēles zemāko un augšējo cenu, šajā problēmā tās atšķiras, t.i. α ≠ β, izmaksas matrica nesatur seglu punktu. Tas nozīmē, ka spēlei nav risinājuma tīrās minimax stratēģijās, taču tai vienmēr ir risinājums jauktās stratēģijās.

Jaukta stratēģija, tās ir tīras stratēģijas, kas nejauši mainās ar noteiktām varbūtībām (frekvencēm).

Mēs apzīmēsim spēlētāja “A” jaukto stratēģiju

S A=

kur B 1, B 2 ir spēlētāja “B” stratēģijas un q 1, q 2 ir attiecīgi varbūtības, ar kurām šīs stratēģijas tiek pielietotas, un q 1 + q 2 = 1.

Spēlētājam “A” optimālā jauktā stratēģija ir tā, kas viņam nodrošina maksimālu peļņu. Attiecīgi “B” ir minimāls zaudējums. Šīs stratēģijas ir noteiktas S A* un S B* attiecīgi. Optimālu stratēģiju pāris veido spēles risinājumu.

IN vispārējs gadījums Spēlētāja optimālā stratēģija var neietvert visas sākotnējās stratēģijas, bet tikai dažas no tām. Šādas stratēģijas sauc aktīvas stratēģijas.

solis: 4


Kur: lpp 1 , lpp 2 — varbūtības (biežums), ar kādām tiek piemērotas attiecīgi stratēģijas A 1 un A 2

No spēles teorijas ir zināms, ka, ja spēlētājs "A" izmanto savu optimālo stratēģiju un spēlētājs "B" paliek savu aktīvo stratēģiju ietvaros, tad vidējā izmaksa paliek nemainīga un ir vienāda ar spēles izmaksām. v neatkarīgi no tā, kā spēlētājs "B" izmanto savas aktīvās stratēģijas. Un mūsu gadījumā abas stratēģijas ir aktīvas, pretējā gadījumā spēlei būtu risinājums tīrās stratēģijās. Tāpēc, ja pieņemam, ka spēlētājs “B” izmantos tīru stratēģiju B 1, tad vidējā izmaksa v būs:

k 11 p 1 + k 21 p 2 = v (1)

Kur: k ij - maksājumu matricas elementi.

No otras puses, ja pieņemam, ka spēlētājs “B” izmantos tīru stratēģiju B 2, tad vidējā izmaksa būs:

k 12 p 1 + k 22 p 2 = v (2)

Pielīdzinot (1) un (2) vienādojuma kreisās puses, iegūstam:

k 11 p 1 + k 21 p 2 = k 12 p 1 + k 22 p 2

Un ņemot vērā faktu, ka lpp 1 + lpp 2 = 1 mums ir:

k 11 p 1 + k 21 (1 - p 1 ) = k 12 p 1 + k 22 (1 - p 1 )


Kur ir viegli atrast stratēģijas A 1 optimālo biežumu:
lpp 1 =
k 22 - k 21
k 11 + k 22 - k 12 - k 21
(3)

Šajā uzdevumā:

lpp 1 =
3
2
- 6
3 +
3
2
- 5 - 6
=
9
13

Varbūtība R 2 atrast ar atņemšanu R 1 no vienības:
lpp 2 = 1 - lpp 1 = 1 -
9
13
= + 6 ·

Kur: q 1 , q 2 - varbūtības (biežumi), ar kurām attiecīgi tiek piemērotas stratēģijas B 1 un B 2

No spēles teorijas ir zināms, ka, ja spēlētājs "B" izmanto savu optimālo stratēģiju un spēlētājs "A" paliek savu aktīvo stratēģiju ietvaros, tad vidējā izmaksa paliek nemainīga un ir vienāda ar spēles izmaksām. v neatkarīgi no tā, kā spēlētājs A izmanto savas aktīvās stratēģijas. Tāpēc, ja mēs pieņemam, ka spēlētājs “A” izmantos tīru stratēģiju A 1, tad vidējā izmaksa v būs:

k 11 q 1 + k 12 q 2 = v (4)


Kopš spēles cenas v mēs to jau zinām un apsveram q 1 + q 2 = 1 , tad stratēģijas B 1 optimālo biežumu var atrast šādi:
q 1 =
v - k 12
k 11 - k 12
(5)

Šajā uzdevumā:

q 1 =
51
13
- 5
3 - 5
=
7
13

Varbūtība q 2 atrast ar atņemšanu q 1 no vienības:
q 2 = 1 - q 1 = 1 -
7
13
=
6
13

Atbilde:

Zemākā spēles cena: α = 3
Labākā spēles cena: β = 5
Spēles cena: v =
51
13
Spēlētāja A optimālā stratēģija:
S A*=
A 1A 2
9
13
4
13

Optimāla stratēģija spēlētājam "B":
S B*=
B 1B 2
7
13
6
13

Ģeometriskā interpretācija (grafiskais risinājums):

Sniegsim aplūkotās spēles ģeometrisku interpretāciju. Paņemiet vienības garuma abscisu ass posmu un caur tās galiem novelciet vertikālas taisnas līnijas a 1 Un a 2 kas atbilst mūsu stratēģijām A 1 un A 2 . Tagad pieņemsim, ka spēlētājs "B" izmantos stratēģiju B 1 collas garumā tīrā formā. Tad, ja mēs (spēlētājs "A") izmantojam tīru stratēģiju A 1, tad mūsu izmaksa būs 3. Atzīmēsim atbilstošo punktu uz ass a 1 .
Ja mēs izmantojam tīru stratēģiju A 2, tad mūsu izmaksa būs 6. Atzīmēsim atbilstošo punktu uz ass a 2
(skat. 1. att.). Acīmredzot, ja mēs pielietosim, sajaucot stratēģijas A 1 un A 2 dažādās proporcijās, mūsu laimesti mainīsies pa taisni, kas iet caur punktiem ar koordinātām (0, 3) un (1, 6), sauksim to par stratēģijas B līniju. 1 (att. .1 parādīts sarkanā krāsā). Jebkura punkta abscise noteiktā taisnē ir vienāda ar varbūtību lpp 2 (biežums), ar kuru mēs pielietojam stratēģiju A 2, un ordinātu - iegūto pieaugumu k (skat. 1. att.).

1. attēls.
Izmaksas grafiks k no frekvences 2. lpp , kad ienaidnieks izmanto stratēģiju B 1.

Tagad pieņemsim, ka spēlētājs “B” izmantos stratēģiju B 2 tās tīrā veidā. Tad, ja mēs (spēlētājs “A”) izmantojam tīro stratēģiju A 1, tad mūsu izmaksa būs 5. Ja mēs izmantojam tīro stratēģiju A 2, tad mūsu izmaksa būs 3/2 (skat. 2. att.). Tāpat, ja mēs sajaucam stratēģijas A 1 un A 2 dažādās proporcijās, mūsu laimesti mainīsies pa taisni, kas iet caur punktiem ar koordinātām (0, 5) un (1, 3/2), sauksim to par stratēģijas līniju. B 2. Tāpat kā iepriekšējā gadījumā, jebkura punkta abscisa uz šīs taisnes ir vienāda ar varbūtību, ar kādu mēs izmantojam stratēģiju A 2, un ordināta ir iegūtais pieaugums, bet tikai stratēģijai B 2 (sk. 2. att.).

2. attēls.
v un optimālā frekvence 2. lpp spēlētājam "A".

Reālā spēlē, kad saprātīgs spēlētājs “B” izmanto visas savas stratēģijas, mūsu laimesti mainīsies pa lauzto līniju, kas parādīta 2. attēlā sarkanā krāsā. Šī līnija definē tā saukto zemākais laimestu limits. Acīmredzot visvairāk augstākais punktsšī pārtrauktā līnija atbilst mūsu optimālajai stratēģijai. IN šajā gadījumā, tas ir stratēģijas B 1 un B 2 līniju krustošanās punkts. Lūdzu, ņemiet vērā, ka, izvēloties frekvenci lpp 2 vienāds ar tās abscisu, tad mūsu ieguvums paliks nemainīgs un vienāds v jebkurai spēlētāja “B” stratēģijai, turklāt tas būs maksimums, ko varam sev garantēt. Biežums (varbūtība) lpp 2 , šajā gadījumā ir mūsu optimālās jauktās stratēģijas atbilstošā frekvence. Starp citu, no 2. attēla var redzēt frekvenci lpp 1 , mūsu optimālā jauktā stratēģija ir segmenta garums [ lpp 2 ; 1] uz x ass. (Tas ir tāpēc lpp 1 + lpp 2 = 1 )

Izmantojot pilnīgi līdzīgu argumentāciju, varam atrast spēlētāja “B” optimālās stratēģijas frekvences, kas ir ilustrētas 3. attēlā.

3. attēls.
Spēles cenas grafiskā noteikšana v un optimālā frekvence q 2 spēlētājam "IN".

Tikai viņam vajadzētu t.s augšējā robeža zaudēšana(sarkana lauzta līnija) un meklējiet tajā zemāko punktu, jo spēlētājam "B" mērķis ir samazināt zaudējumus. Tāda pati frekvences vērtība q 1 , tas ir segmenta garums [ q 2 ; 1] uz x ass.

Saturs 1 Galvenā informācija 2 1.1 Spēles. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Kustības. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3. Stratēģijas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 Matrix spēle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 Takas punkts. Tīras stratēģijas 7 2.1. Piemēri. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1. piemērs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2. piemērs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 Jauktas stratēģijas 9 3.1 Spēle 2×2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1. Piemēri. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3. piemērs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 4. piemērs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.2. Ģeometriskā interpretācija. . . . . . . . . . . . . . . . . . . . 12 3.2 Spēles 2×n un m×2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 5. piemērs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1 1. Vispārīga informācija no spēļu teorijas 1.1. Spēles Spēļu teorija ir konfliktsituāciju matemātiska teorija, t.i. situācijas, kurās saduras divu vai vairāku pušu intereses, kuru mērķis ir dažādi mērķi. Spēle ir ar noteiktiem noteikumiem regulēta konfliktsituācija, kurā jānorāda: iespējamās dalībnieku rīcības iespējas; spēles vai maksājuma kvantitatīvais rezultāts (uzvarēšana, zaudējums), pie kura noved dotā gājienu kopa; informācijas apjoms. par otras puses uzvedību. Dubultspēle ir spēle, kurā piedalās tikai divas puses (divi spēlētāji). Nulles summas pāru spēle ir pāru spēle, kurā maksājumu summa ir nulle, t.i. Viena spēlētāja zaudējums ir vienāds ar otrā spēlētāja ieguvumu. Atkarībā no katra spēlētāja attieksmes pret izmaksas funkcijas vērtību, pāru spēles tiek iedalītas: Nulles summas pāru spēle (antagonistiska) - pāru spēle, kurā maksājumu summa ir vienāda ar nulli, t.i. Viena spēlētāja zaudējums ir vienāds ar otrā spēlētāja ieguvumu. Ne-antagonistiska spēle ir pāru spēle, kurā spēlētāji tiecas pēc dažādiem, bet ne tieši pretējiem mērķiem. 2 1.2. Moves Move - vienas no spēles noteikumos paredzētajām darbībām izvēle; šīs izvēles īstenošana. Gājieni ir divu veidu: Personīgais gājiens - + apzināta vienas no spēles noteikumos paredzētās darbības izvēle + realizācija no šīs izvēles Nejaušs gājiens — nejaušs gājiens ir izvēle no vairākām iespējām, kas netiek veikta ar spēlētāja lēmumu, bet gan ar kādu nejaušas izvēles mehānismu. Tālāk mēs aplūkojam nulles summas pāru spēles, kurās ir tikai personīgi gājieni. Katrai pusei trūkst informācijas par otras uzvedību. 3 1.3. Stratēģijas Spēlētāja stratēģija ir noteikumu kopums, kas nosaka darbību izvēli katram šī spēlētāja personīgajam gājienam atkarībā no situācijas, kas rodas spēles laikā. Atkarībā no iespējamo stratēģiju skaita spēles tiek iedalītas ierobežotās un bezgalīgās. Bezgalīga spēle ir spēle, kurā ir vismaz viens no spēlētājiem bezgalīgs skaitlis stratēģijas. Ierobežota spēle ir spēle, kurā katram spēlētājam ir tikai ierobežots skaits stratēģiju. Jebkura spēlētāja secīgo gājienu skaits nosaka spēļu sadalījumu vienā gājienā un vairākos gājienos vai pozicionālajās. + Viena gājiena spēlē katrs spēlētājs izdara tikai vienu izvēli no iespējamajiem variantiem un pēc tam nosaka spēles iznākumu. + Laika gaitā attīstās vairāku gājienu jeb pozicionālā spēle, kas atspoguļo secīgu posmu sēriju, no kuriem katrs notiek pēc viena no spēlētājiem gājiena un atbilstošas ​​situācijas maiņas. Viena gājiena spēlē katrs spēlētājs izdara tikai vienu izvēli iespējamie varianti un pēc tam nosaka spēles iznākumu. Spēlētāja optimālā stratēģija ir stratēģija, kas, spēlei atkārtojot vairākas reizes, nodrošina šim spēlētājam maksimāli iespējamo vidējo uzvaru (vai, kas ir tas pats, minimālo iespējamo vidējo zaudējumu). Spēļu teorijā visi ieteikumi tiek sniegti, pamatojoties uz pieņēmumu par spēlētāju saprātīgu uzvedību. Spēlētāju aprēķini un kļūdas, kas ir neizbēgamas katrā konfliktsituācijā, kā arī azarts un riska elementi spēles teorijā netiek ņemti vērā. 4 1.4. Matricas spēle Matricas spēle ir viena gājiena galīgās nulles summas spēle.Matricas spēle ir spēles teorētiskais modelis konfliktsituācijai, kurā pretinieki, lai sasniegtu diametrāli pretējus mērķus, izdara vienu izvēli (gājienu) no galīgas. numuru iespējamie veidi darbības.Saskaņā ar izvēlētajām rīcības metodēm (stratēģijām) tiek noteikts sasniegtais rezultāts. Apskatīsim piemēru. Lai ir divi spēlētāji A un B, no kuriem viens var izvēlēties i-tā stratēģija no m no savām iespējamām stratēģijām A1, A2, ...Am, un otrā izvēlas j-to stratēģiju no savām iespējamām stratēģijām B1, B2, ...Bm. Rezultātā pirmais spēlētājs iegūst vērtību aij, bet otrais zaudē šo vērtību. No skaitļiem aij izveidojam matricu   a11 a11 · · · a1n  a21 a22 · · · a2n    A = (aij) =  .. .. ..   . . . .  am1 am2 · · · amn Matricu A = (aij), i = 1, m, j = 1, n sauc par izmaksas matricu jeb m × n spēles matricu. Šajā matricā rindas vienmēr ir paredzētas uzvarošā (maksimizējošā) spēlētāja A stratēģijām, tas ir, spēlētāja, kurš cenšas palielināt savu laimestu. Ailes tiek piešķirtas zaudējušā spēlētāja B stratēģijām, tas ir, spēlētāja, kurš cenšas samazināt efektivitātes kritēriju. Spēles normalizācija ir process, kurā pozicionālā spēle tiek reducēta uz matricas spēli. Spēle normālā formā ir pozicionāla spēle, kas reducēta līdz matricas spēlei. Atcerēsimies, ka pozicionālā vairāku kustību spēle ir spēles teorētiskais modelis konfliktsituācija, kurā pretinieki secīgi izdara vienu izvēli (gājienu) no ierobežota skaita iespējamo rīcības virzienu katrā šīs situācijas attīstības stadijā. Spēles risinājums ir abu spēlētāju optimālo stratēģiju atrašana un spēles cenas noteikšana.Spēles cena ir spēlētāju sagaidāmais ieguvums (zaudējums). Spēles risinājumu var atrast vai nu tīrās stratēģijās - kad spēlētājam ir jāievēro viena stratēģija, vai arī jauktās, kad spēlētājam ir jāizmanto divas vai vairākas tīras stratēģijas ar noteiktām varbūtībām. Pēdējos šajā gadījumā sauc par aktīviem. 5 Viena spēlētāja jauktā stratēģija ir vektors, kura katra sastāvdaļa parāda atbilstošās tīrās stratēģijas spēlētāja lietošanas biežumu. Spēles maksimālā vai zemākā cena - skaitlis α = max min aij i j Maksimālā stratēģija (rinda) - stratēģija, kuru spēlētājs izvēlējās, lai maksimāli palielinātu savu minimālo laimestu. Acīmredzot, izvēloties vispiesardzīgāko maksimuma stratēģiju, spēlētājs A nodrošina sev (neatkarīgi no pretinieka uzvedības) garantētu izmaksu vismaz α. Spēles maksimālā jeb augšējā cena - skaitlis β = min max aij j i Minimax stratēģija (kolonna) - stratēģija, kuru spēlētājs izvēlējās, lai samazinātu maksimālos zaudējumus. Acīmredzot, izvēloties vispiesardzīgāko minimax stratēģiju, spēlētājs B nekādā gadījumā neļauj spēlētājam A uzvarēt vairāk par β. Spēles zemākā cena vienmēr nepārsniedz spēles augšējo cenu α = max min aij 6 min max aij = β i j j i 1. teorēma (matricas spēļu teorijas galvenā teorēma). Katrai ierobežotai spēlei ir vismaz viens risinājums, iespējams, jauktu stratēģiju jomā. 6 2. Spēles ar seglu punktu. Risinājums tīrās stratēģijās Spēle ar seglu punktu ir spēle, kurai α = max min aij = min max aij = β i j j i Spēlēm ar seglu punktu risinājuma atrašana ir optimālo maximin un minimax stratēģiju izvēle. Tīrā spēles cena - vispārīga nozīme spēles zemākās un augšējās cenas α=β=ν 2.1. Piemēri 1. piemērs Atrodiet risinājumu tīrās spēles stratēģijās, ko sniedz matrica   8 4 7 A= 6 5 9  7 7 8 Risinājums: nosakiet spēles augšējo un apakšējo cenu. Lai to izdarītu, mēs atrodam skaitļu aij minimumu i-tā rinda αi = min aij j un skaitļu aij maksimums j-tajā kolonnā βj = max aij i Ciparus αi (rindas minimumi) rakstīsim blakus maksājumu matricai labajā pusē papildu kolonnas veidā. Zem matricas ierakstām skaitļus βi (kolonnas maksimumus) papildu rindas veidā: αi 8 4 7 4 6 5 9 5 7 7 8 7 βj 8 7 9 7 Atrodiet skaitļu maksimumu αi α = max αi = 7 i un skaitļu minimums βj β = min βj = 7 j α = β - spēlei ir seglu punkts. Spēlētājam optimālā stratēģija ir stratēģija A3, bet spēlētājam B stratēģija B2, spēles neto cena ν = 7 2. piemērs Maksājumu matrica ir dota:   2 2 1 1 2  0 1 1 1 1  A=  1 1 1 1 2   1 2 1 1 2 Atrodiet spēles risinājumu tīrās stratēģijās. Risinājums: 2 2 1 1 2 1 0 1 1 1 1 0 1 1 1 1 2 1 1 2 1 1 2 1 βj 2 2 1 1 2 α = β = 1. Spēlei ir seši seglu punkti. Optimālās stratēģijas būs: A1 un B3 vai B4 A3 un B3 vai B4 A4 un B3 vai B4 8 3. Spēles risinājums jauktās stratēģijās Kad α = β. Gadījumā, ja, izvēloties savas stratēģijas, abiem spēlētājiem nav informācijas par otra izvēli, spēlei ir risinājums jauktās stratēģijās. SA = (p1, p2, ..., pm) - spēlētāja A jaukta stratēģija, kurā tiek pielietotas stratēģijas A1, A2, ..., Am ar varbūtībām ∑ m p1, p2, ..., pm, pi = 1, pi > 0, i = 1, m i=1 SB = (q1, q2, ..., qn) - spēlētāja B jaukta stratēģija, kurā tiek pielietotas stratēģijas B1, B2, ..., Bm ar varbūtībām ∑ n q1, q2 , ..., qm , qi = 1, qi > 0, i = 1, n i=1 Ja: SA∗ ir spēlētāja A optimālā stratēģija, SB∗ ir spēlētāja B optimālā stratēģija, tad spēles izmaksas ir ∑ n ∑ m ν = aij · p∗i · qi∗ j=1 i=1 Sekojošā teorēma atbild uz jautājumu, kā atrast risinājumu spēlēm 2 × 2, 2 × n, m × 2 2. teorēma (kā atrast atrisinājumu spēlēm 2 × 2, 2 × n, m × 2). Ja kāds no spēlētājiem izmanto optimālu jauktu stratēģiju, tad viņa izmaksa ir vienāda ar spēles izmaksām ν, neatkarīgi no varbūtības, ar kādu otrais spēlētājs izmantos optimālajā (ieskaitot tīrās stratēģijas) iekļautās stratēģijas. 9 3.1. 2 × 2 spēle Apsveriet 2 × 2 spēli ar matricu: () a11 a21 a21 a22 Lai spēlei nebūtu risinājuma tīrās stratēģijās. Atradīsim optimālās stratēģijas SA∗ un SB∗. Pirmkārt, mēs definējam stratēģiju SA∗ = (p∗1 , p∗2). Saskaņā ar teorēmu, ja partija A pieturas pie stratēģijas ν, tad neatkarīgi no partijas B darbības virziena izmaksa paliks vienāda ar spēles izmaksām ν. Līdz ar to, ja puse A ievēro optimālo stratēģiju SA∗ = (p∗1 , p∗2), tad puse B var pielietot jebkuru no savām stratēģijām, nemainot tās atdevi. Tad, kad spēlētājs B izmanto tīru stratēģiju B1 vai B2, spēlētājs saņems vidējo izmaksu, kas vienāda ar spēles izmaksām: a11 p∗1 + a21 p∗2 = ν ← stratēģijai B1 a12 p∗1 + a22 p∗. 2 = ν ← stratēģijai B2 Ņemot vērā, ka p∗1 + p∗2 = 1: p∗1 = a2 2−a2 1 a11 +a22 −a12 −a21 p∗2 = a1 1−a1 2 a11 +a22 −a12 −a21 Spēles cena: a22 a11 − a12 a21 ν= a11 + a22 − a12 − a21 Spēlētāja B optimālā stratēģija atrodama līdzīgi: SB∗ = (q1∗ , q2∗). Ņemot vērā, ka q1∗ + q2∗ = 1: q1∗ = a2 2−a1 2 a11 +a22 −a12 −a21 q2∗ = a1 1−a2 1 a11 +a22 −a12 −a21 3.1.1. Piemēri 3. piemērs Atrodi atrisinājumu spēlei ar matricu () −1 1 A= 1 −1 10 Risinājums: spēlei nav seglu punkta, jo α= -1, β = 1, α ̸= β. Mēs meklējam risinājumu jauktās stratēģijās. Izmantojot formulas p∗ un q∗, iegūstam p∗1 = p∗2 = 0,5 un q1∗ = q2∗ = 0,5, ν = 0 Tādējādi SA∗ = (0,5, 0,5) SB∗ = (0,5, 0,5) ) 4. piemērs Atrodi atrisinājumu spēlei ar matricu () 2 5 A= 6 4 Risinājums: spēlei nav seglu punkta, jo α= 4, β = 5, α ̸= β. Mēs meklējam risinājumu jauktās stratēģijās. Izmantojot formulas p∗ un q∗, iegūstam p∗1 = 0,4, p∗2 = 0,6 un q1∗ = 0,2 q2∗ = 0,8, ν = 4,4 Tādējādi SA∗ = (0,4, 0,6) SB∗ = ( 0,2, 0,8) 11 3.1.2. Ģeometriskā interpretācija Spēlei 2 × 2 var sniegt vienkāršu ģeometrisko interpretāciju. Ņemsim vienu abscisu ass posmu, kura katru punktu saistām ar kādu jauktu stratēģiju S = (p1, p2) = (p1, 1 − p1) un stratēģijas A1 varbūtība p1 būs vienāda ar attālumu no punkts SA sekcijas labajā galā, un varbūtība p2 , stratēģija A2 - attālums līdz kreisajam galam. .y .I .I I .B1′ .N .B1 .a21 .a11 .I I .I .∗ .x .P2 .SA∗ .P1∗ Jo īpaši atbilst sadaļas kreisais gals (punkts ar abscisu = 0). uz stratēģiju A1, segmenta labais gals (x = 1) - stratēģija A2 Nogriežņa galos tiek atjaunoti divi perpendikulāri x asij: I ass - I - stratēģijas A1 izmaksa tiek atlikta; II ass - II - stratēģijas A2 izmaksa tiek atlikta Ļaujiet spēlētājam B pielietot stratēģiju B1; tas dod uz asīm I − I un II − II attiecīgi punktus ar ordinātām a11 un a21. Caur šiem punktiem novelkam taisnu līniju B1 − B1′. Jebkurai jauktai stratēģijai SA = (p1, p2), spēlētāja izmaksu nosaka punkts N uz taisnes B1 − B1′, kas atbilst punktam SA uz x ass, kas sadala segmentu proporcijā p2: p1. Acīmredzot taisni B2 − B2′, kas nosaka atdevi stratēģijai B2, var izveidot tieši tādā pašā veidā. 12 .y .I .I I .B2 .N .a21 .B2′ a . 22 .I I .I .∗ .x .P2 .SA∗ .P1∗ Nepieciešams atrast optimālo stratēģiju SA∗ , t.i. tā, lai spēlētāja A minimālā peļņa (ņemot vērā spēlētāja B sliktāko uzvedību viņam) pārvērstos par maksimālo. Lai to izdarītu, konstruējiet spēlētāja A izmaksu apakšējo robežu stratēģijām B1, B2, t.i. lauzta līnija B1 N B2′ ;. Uz šīs robežas atradīsies spēlētāja A minimālā izmaksa par jebkuru no viņa jauktajām stratēģijām, punkts N, kurā šī izmaksa sasniedz maksimumu un nosaka spēles lēmumu un cenu. .y .I .I I .B2 .B1′ .N .B1 .B2′ .I I .I .∗ .x .P2 . A∗ S . 1∗ P Punkta N ordināta nav nekas vairāk kā spēles izmaksas ν, tās abscisa ir vienāda ar ∗2, un attālums līdz segmenta labajam galam ir vienāds ar ∗1, t.i. attālums no punkta SA∗ līdz segmenta galiem ir vienāds ar spēlētāja A optimālās jauktās stratēģijas stratēģiju A2 un A1 varbūtībām ∗2 un ∗1. šajā gadījumā spēles atrisinājumu noteica stratēģijas B1 un B2 krustošanās punkts. Zemāk ir gadījums, kad spēlētāja optimālā stratēģija ir tīra stratēģija A2. Šeit stratēģija A2 (jebkurai ienaidnieka stratēģijai) ir ienesīgāka nekā stratēģija A1, 13 .y .y .I .I I .I I. I .B2′ . 1′ B .B1′ B . 2 .B2′ B . 2 .B1 .ν = a21 .B1 .ν = a21 I. I I. I .I . .x .I . .x. 2∗ P . A∗S = A2. 2∗ P . A∗ S = A2 Pa labi parādīts gadījums, kad spēlētājam B ir acīmredzami neizdevīga stratēģija. Ģeometriskā interpretācija arī ļauj vizualizēt spēles zemāko cenu α un augšējo cenu β .y .I .I I .B2 .B1′ .N .B1 . B2′ .β = a21 .α = a22 .I I .I .∗ .x .P2 . A∗ S . 1∗ P Šajā pašā grafikā varam sniegt arī spēlētāja B optimālo stratēģiju ģeometrisku interpretāciju. Ir viegli pārbaudīt, vai optimālās jauktās stratēģijas SB∗ = (q1∗ , q2∗) stratēģijas B1 daļa ir vienāda ar segmenta KB2 garuma attiecību pret segmentu KB1 garumu summu. un KB2 uz I − I ass: .y .I .I I .B2 . B1′ .N .K .L .B1 .B2′ .I I .I .∗ .x .P2 . A∗ S . 1∗ P 14 KB2 q1∗ = KB2 + KB1 vai LB2′ q1∗ = LB2′ + LB1′ Optimālo stratēģiju SB∗ = (q1∗ , q2∗) var atrast citā veidā, ja apmainām spēlētājus B un B, un tā vietā laimestu apakšējās robežas maksimums, ņemiet vērā augšējās robežas minimumu. .y .I .I I .A2 .A′1 .N .A1 .A′2 .I I .I . .x .q2∗ . B∗ S .q1∗ 15 3.2. 2 × n un m × 2 spēles 2 × n un m × 2 spēļu atrisinājums ir balstīts uz šādu teorēmu. 3. teorēma. Jebkurai galīgai spēlei m × n ir risinājums, kurā katras puses aktīvo stratēģiju skaits nepārsniedz mazāko no skaitļiem m un n. Saskaņā ar šo teorēmu 2 × n spēlei vienmēr ir risinājums, kurā katram spēlētājam ir ne vairāk kā divas aktīvas stratēģijas. Kad esat atradis šīs stratēģijas, 2 × n spēle pārvēršas par 2 × 2 spēli, kuru var atrisināt elementāri. Aktīvo stratēģiju atrašanu var veikt grafiski: 1) tiek konstruēta grafiskā interpretācija; 2) tiek noteikta laimesta apakšējā robeža; 3) pie izmaksas apakšējās robežas tiek identificētas divas otrā spēlētāja stratēģijas, kas atbilst divām līnijām, kas krustojas punktā ar maksimālo ordinātu (ja šajā punktā krustojas vairāk nekā divas līnijas, tiek ņemts jebkurš pāris) - šīs stratēģijas attēlo spēlētāja B aktīvās stratēģijas. Tādējādi spēle 2 × n tiek reducēta līdz spēlei 2 × 2. Var atrisināt arī spēli m × 2, ar atšķirību, ka ir nevis apakšējā, bet augšējā izmaksas robeža. konstruēts, un uz tā tiek meklēts nevis maksimums, bet gan minimums. 5. piemērs Atrodiet spēles risinājumu () 7 9 8 A= 10 6 9 Risinājums: izmantojot ģeometrisko metodi, izvēlamies aktīvās stratēģijas. Tiešās līnijas B1 − B1′, B2 − B2′ un B3 − B3′ atbilst stratēģijām B1, B2, B3. Lauztā līnija B1 N B2 ir spēlētāja laimestu apakšējā robeža. Spēlei ir risinājums S∗A = (23, 31); S∗B = (0,5; 0,5; 0); v = 8. 16 .y .I .I I . 1′ B B . 2 .B3′ .N .B3 .B1 .B2′ .I I .I . .x. 2∗ P . A∗ S . 1∗ P 17 Rādītāja spēle, 2 gājieni, 3 2 × 2, 10 personīgi, 3 2 × 2, 9 nejauši, 3 ģeometrija, 12 neto spēles cena, 7 piemēri, 10 2 × n, 9, 16 m × 2, 9 , 16 bezgalīgas, 4 parastā formā, 5 ierobežotas, 4 vairāku kustību, 4 vienas kustības, 4 matricas, 5 pārī, 2 nulles summas, 2 antagonistiskas, 2 neantagonistiskas, 2 risinājums, 5 jauktās stratēģijās, 5 , 9 tīrās stratēģijās , 5 ar seglu punktu, 7 cena, 5 augšējie, 6 apakšējie, 6 tīrie, 7 maksimumi, 6 spēļu matrica, 5 izmaksa, 5 minimax, 6 spēles normalizēšana, 5 stratēģijas, 4 maksimumi, 6 minimālie maksimumi, 6 optimāls, 4 jauktas, 5 spēļu teorija, 2 18

No populārā amerikāņu emuāra Cracked.

Spēļu teorija ir par to, kā pētīt veidus, kā veikt vislabāko gājienu un rezultātā iegūt pēc iespējas vairāk laimesta pīrāga, daļu no tā nogriežot no citiem spēlētājiem. Tas māca analizēt daudzus faktorus un izdarīt loģiski līdzsvarotus secinājumus. Es domāju, ka tas ir jāpēta pēc cipariem un pirms alfabēta. Vienkārši tāpēc, ka pārāk daudz cilvēku pieņem svarīgus lēmumus, balstoties uz intuīciju, slepeniem pareģojumiem, zvaigžņu atrašanās vietu un tamlīdzīgi. Esmu pamatīgi apguvis spēļu teoriju, un tagad vēlos pastāstīt par tās pamatiem. Varbūt tas jūsu dzīvei pievienos veselo saprātu.

1. Ieslodzīto dilemma

Berto un Roberts tika arestēti par bankas aplaupīšanu, jo nebija pareizi izmantojuši zagtu automašīnu, lai aizbēgtu. Policija nevar pierādīt, ka viņi bija tie, kas aplaupīja banku, taču pieķēra viņus zagtā automašīnā. Viņi tika nogādāti dažādās telpās, un katram tika piedāvāts darījums: nodot līdzdalībnieku un nosūtīt viņu uz 10 gadiem cietumā un pašam tikt atbrīvotam. Bet ja abi nodos viens otru, tad katrs saņems 7 gadus. Ja neviens neko neteiks, tad abi ies cietumā uz 2 gadiem tikai par auto zādzību.

Izrādās, ja Berto klusē, bet Roberts viņu padod, Berto nonāk cietumā uz 10 gadiem, un Roberts tiek brīvībā.

Katrs ieslodzītais ir spēlētājs, un katra labums var izpausties kā "formula" (ko saņem abi, ko iegūst otrs). Piemēram, ja es tev trāpītu, mans uzvaras modelis izskatītos šādi (es gūstu rupju uzvaru, tu ciet no stipras sāpes). Tā kā katram ieslodzītajam ir divas iespējas, rezultātus varam parādīt tabulā.

Praktiskais pielietojums: sociopātu identificēšana

Šeit mēs redzam galveno spēļu teorijas pielietojumu: identificēt sociopātus, kuri domā tikai par sevi. Patiesa spēļu teorija ir spēcīgs analītisks instruments, un amatierisms bieži vien kalpo kā sarkans karogs, kas apzīmē kādu, kam nav goda sajūtas. Cilvēki, kas veic intuitīvus aprēķinus, uzskata, ka labāk ir izdarīt kaut ko neglītu, jo tas rezultēsies ar īsāku cietumsodu neatkarīgi no tā, ko dara otrs spēlētājs. Tehniski tas ir pareizi, bet tikai tad, ja esat tuvredzīgs cilvēks, kas liek skaitļus augstākus cilvēku dzīvības. Tāpēc spēļu teorija ir tik populāra finanšu jomā.

Ieslodzīto dilemmas patiesā problēma ir tā, ka tā ignorē datus. Piemēram, tā neņem vērā iespēju, ka jūs tikties ar tās personas draugiem, radiem vai pat kreditoriem, kuru nosūtījāt cietumā uz 10 gadiem.

Sliktākais ir tas, ka visi, kas ir iesaistīti ieslodzīto dilemmā, rīkojas tā, it kā viņi par to nekad nebūtu dzirdējuši.

Un labākais solis ir klusēt un pēc diviem gadiem kopā ar labu draugu izmantot to pašu naudu.

2. Dominējošā stratēģija

Šī ir situācija, kurā jūsu rīcība dod lielākā uzvara, neatkarīgi no pretinieka darbībām. Neatkarīgi no tā, kas notiek, jūs visu izdarījāt pareizi. Tāpēc daudzi cilvēki ar ieslodzīto dilemmu uzskata, ka nodevība noved pie "labākā" iznākuma neatkarīgi no tā, ko dara otrs, un šai metodei raksturīgā realitātes nezināšana padara to ļoti vieglu.

Lielākajai daļai spēļu, kuras mēs spēlējam, nav stingri dominējošu stratēģiju, jo pretējā gadījumā tās būtu briesmīgas. Iedomājieties, ja jūs vienmēr darītu to pašu. Akmens-papīra-šķēru spēlē nav dominējošas stratēģijas. Bet, ja jūs spēlējaties ar cilvēku, kuram ir cepeškrāsns dūraiņi un kurš varētu rādīt tikai akmeni vai papīru, jums būtu dominējošā stratēģija: papīrs. Jūsu papīrs iesaiņos viņa akmeni vai rezultāts būs neizšķirts, un jūs nevarat zaudēt, jo jūsu pretinieks nevar parādīt šķēres. Tagad, kad jums ir dominējoša stratēģija, jūs būtu muļķis, ja mēģinātu kaut ko citu.

3. Dzimumu cīņa

Spēles ir interesantākas, ja tām nav stingri dominējošas stratēģijas. Piemēram, dzimumu cīņa. Anjali un Borislavs dodas uz randiņu, taču nevar izvēlēties starp baletu vai boksu. Andžali ļoti patīk bokss, jo viņai patīk redzēt, kā plūst asinis, par prieku kliedzošajam skatītāju pūlim, kuri domā, ka ir civilizēti tikai tāpēc, ka samaksājuši par to, lai kādam tiktu sasista galva.

Borislavs vēlas skatīties baletu, jo saprot, kam balerīnas pārdzīvo liela summa traumas un grūtākais treniņš, zinot, ka viena trauma var beigt visu. Baletdejotāji - izcilākie sportisti uz zemes. Balerīna tev var iesist pa galvu, bet viņa to nekad nedarīs, jo viņas kāja ir daudz vairāk vērta nekā tava seja.

Katrs no viņiem vēlas doties uz savu iecienītāko pasākumu, bet nevēlas to izbaudīt vienatnē, tāpēc uzvar šādi: augstākā vērtība- darīt to, kas viņiem patīk, mazākā vērtība- vienkārši būt kopā ar otru cilvēku, un nulle - būt vienam.

Daži cilvēki iesaka spītīgu stulbumu: ja jūs darāt to, ko vēlaties, lai arī ko darītu, otrai personai ir jāpakļaujas jūsu izvēlei vai jāzaudē viss. Kā jau teicu, vienkāršotā spēļu teorija lieliski palīdz identificēt muļķus.

Praktisks pielietojums: Izvairieties no asiem stūriem

Protams, šai stratēģijai ir arī būtiski trūkumi. Pirmkārt, ja jūs izturēsities pret randiņiem kā pret "dzimumu kauju", tas nedarbosies. Šķirieties, lai katrs no jums atrastu kādu, kas viņam patīk. Un otrā problēma ir tā, ka šajā situācijā dalībnieki ir tik nepārliecināti par sevi, ka nevar to izdarīt.

Patiesi uzvarošā stratēģija ikvienam ir darīt to, ko viņi vēlas. un pēc, vai nākamajā dienā, kad viņi ir brīvi, ejiet kopā uz kafejnīcu. Vai pārmaiņus starp boksu un baletu, līdz izklaides pasaulē notiek revolūcija un tiek izgudrots boksa balets.

4. Neša līdzsvars

Neša līdzsvars ir kustību kopums, kurā neviens pēc fakta nevēlas kaut ko darīt savādāk. Un, ja mēs spēsim panākt, lai tas darbotos, spēļu teorija aizstās visu filozofisko, reliģisko un finanšu sistēmu uz planētas, jo cilvēcei ir kļuvusi spēcīgāka "griba nesabrukt". dzinējspēks nekā uguns.

Ātri sadalīsim $100. Mēs ar jums izlemjam, cik no simtiem mums ir nepieciešams, un tajā pašā laikā paziņojam summas. Ja mūsu kopējā summa mazāk par simtu, katrs saņem to, ko gribēja. Ja Kopā vairāk nekā simts, tas, kurš prasīja vismazāko, saņem vēlamo summu, un mantkārīgākais saņem to, kas paliek pāri. Ja mēs prasām vienādu summu, visi saņem 50 USD. Cik tu prasīsi? Kā jūs sadalīsiet naudu? Ir tikai viens uzvarošs gājiens.

Pieprasot 51 $, jūs iegūsit maksimālā summa neatkarīgi no tā, ko pretinieks izvēlas. Ja viņš prasīs vairāk, jūs saņemsiet $51. Ja viņš prasīs $ 50 vai $ 51, jūs saņemsiet $ 50. Un, ja viņš prasīs mazāk nekā 50 USD, jūs saņemsit 51 USD. Jebkurā gadījumā nav citas iespējas, kas dotu jums vairāk naudas, nekā šī. Neša līdzsvars – situācija, kurā mēs abi izvēlamies $51.

Praktisks pielietojums: vispirms padomā

Tā ir visa spēles teorijas būtība. Jums nav jāuzvar, vēl jo mazāk jākaitē citiem spēlētājiem, taču jums ir jāizdara vislabākais gājiens sev neatkarīgi no tā, ko apkārtējie jums ir sagatavojuši. Un vēl labāk, ja šis solis ir izdevīgs citiem spēlētājiem. Šī ir tāda matemātika, kas varētu mainīt sabiedrību.

Interesanta šīs idejas variācija ir dzeršana, ko var saukt par laika atkarīgu Neša līdzsvaru. Kad tu dzer pietiekami daudz, tev vienalga par citu cilvēku rīcību, lai ko viņi arī darītu, bet nākamajā dienā tu tiešām nožēlo, ka neizdarīji kaut ko savādāk.

5. Izmest spēle

Iemetiens tiek izspēlēts starp 1. un 2. spēlētāju. Katrs spēlētājs vienlaikus izvēlas galvas vai astes. Ja viņi uzmin pareizi, 1. spēlētājs saņem 2. spēlētāja pensu. Ja nē, 2. spēlētājs saņem 1. spēlētāja monētu.

Uzvarētāju matrica ir vienkārša...

...optimāla stratēģija: spēlējiet pilnīgi nejauši. Tas ir grūtāk, nekā jūs domājat, jo atlasei ir jābūt pilnīgi nejaušai. Ja jums ir priekšroka galvas vai astes, jūsu pretinieks var to izmantot, lai atņemtu jūsu naudu.

Protams, patiesā problēma šeit ir tāda, ka būtu daudz labāk, ja viņi viens otram iemestu vienu santīmu. Rezultātā viņu peļņa būtu tāda pati, un no tā izrietošā trauma varētu palīdzēt šiem nelaimīgajiem cilvēkiem sajust ko citu, nevis šausmīgu garlaicību. Galu galā šis sliktākā spēle kādreiz pastāvoša. Un šis ir ideāls modelis soda sitienu sērijai.

Praktiskais pielietojums: Sods

Futbolā, hokejā un daudzās citās spēlēs papildlaiks ir soda sitienu sērija. Un tie būtu interesantāki, ja tie būtu balstīti uz to, cik reizes spēlētāji pilna forma varētu uztaisīt pajūgu, jo tas vismaz liecinātu par viņu fiziskajām spējām un būtu jautri skatīties. Vārtsargi nevar skaidri noteikt bumbas vai ripas kustību pašā tās kustības sākumā, jo diemžēl mūsu sporta sacensībās joprojām nepiedalās roboti. Vārtsargam ir jāizvēlas kreisais vai labais virziens un jācer, ka viņa izvēle sakrīt ar pretinieka izvēli, kurš met pa vārtiem. Tam ir kaut kas kopīgs ar monētu spēlēšanu.

Tomēr ņemiet vērā, ka šis nav ideāls piemērs līdzībai ar galvu un astes spēli, jo pat tad, ja izdarīt pareizo izvēli virzienā, vārtsargs nedrīkst tvert bumbu, un uzbrucējs nedrīkst trāpīt vārtos.

Tātad, kāds ir mūsu secinājums saskaņā ar spēļu teoriju? Bumbu spēlēm jābeidzas "vairāku bumbu" veidā, kur katru minūti viens pret vienu spēlētājiem tiek dota papildu bumba/ripa, līdz viena puse sasniedz noteiktu rezultātu, kas liecina par spēlētāju patieso meistarību, un nav iespaidīga nejauša sakritība.

Dienas beigās ir jāizmanto spēļu teorija, lai padarītu spēli gudrāku. Tas nozīmē, ka tas ir labāk.

Spēļu teorija kā operāciju izpētes nozare tā ir matemātisko modeļu teorija optimālu lēmumu pieņemšanai nenoteiktības vai vairāku pušu ar atšķirīgu interešu konflikta apstākļos. Spēļu teorija pēta optimālas stratēģijas spēļu situācijās. Tie ietver situācijas, kas saistītas ar ienesīgāko ražošanas risinājumu izvēli zinātnisko un ekonomisko eksperimentu sistēmai, organizācijai statistiskā kontrole, ekonomiskās attiecības starp rūpniecības uzņēmumiem un citām nozarēm. Formalizēšana konfliktsituācijas matemātiski tos var attēlot kā divu, trīs utt. spēlētāji, no kuriem katrs cenšas palielināt savu labumu, laimestu uz otra rēķina.

Sadaļu "Spēļu teorija" pārstāv trīs tiešsaistes kalkulatori:

  1. Optimālas spēlētāju stratēģijas. Šādās problēmās tiek norādīta maksājumu matrica. Ir jāatrod tīras vai jauktas spēlētāju stratēģijas un spēles cena. Lai atrisinātu, jānorāda matricas dimensija un risinājuma metode. Pakalpojums īsteno šādas metodes risinājumi divu spēlētāju spēlei:
    1. Minimax. Ja jums ir jāatrod spēlētāju tīrā stratēģija vai jāatbild uz jautājumu par spēles pamatpunktu, izvēlieties šo risinājuma metodi.
    2. Vienkāršā metode. Izmanto, lai atrisinātu jauktas stratēģijas spēles, izmantojot lineārās programmēšanas metodes.
    3. Grafiskā metode. Izmanto, lai atrisinātu jauktas stratēģijas spēles. Ja ir seglu punkts, risinājums apstājas. Piemērs. Dotajai maksājumu matricai atrodiet optimālās jauktās spēlētāju stratēģijas un izmantotās spēles cenu grafiskā metode spēļu risinājumi.
    4. Brauna-Robinsona iteratīvā metode. Iteratīvo metodi izmanto, ja grafiskā metode nav piemērojama un kad algebriskā un matricas metodes. Šī metode dod aptuvenu spēles cenas vērtību, un patieso vērtību var iegūt ar jebkuru vēlamo precizitātes pakāpi. Šī metode nav pietiekama, lai atrastu optimālas stratēģijas, taču tā ļauj izsekot uz gājieniem balstītas spēles dinamikai un noteikt spēles izmaksas katram spēlētājam katrā solī.
    Piemēram, uzdevums var izklausīties šādi: “norādīt spēlētāju optimālās stratēģijas spēlei, ko nosaka izmaksu matrica”..
    Visas metodes izmanto dominējošo rindu un kolonnu pārbaudi.
  2. Bimatrix spēle. Parasti šādā spēlē tiek norādītas divas vienāda lieluma pirmā un otrā spēlētāja izmaksu matricas. Šo matricu rindas atbilst pirmā spēlētāja stratēģijām, un matricu kolonnas atbilst otrā spēlētāja stratēģijām. Šajā gadījumā pirmā matrica atspoguļo pirmā spēlētāja laimestu, bet otrā - otrā spēlētāja laimestu.
  3. Spēles ar dabu. Izmanto, kad nepieciešams izvēlēties vadības lēmums pēc Maximax, Bayes, Laplasa, Wald, Savage, Hurwitz kritērijiem.
    Beijesa kritērijam būs jāievada arī notikumu rašanās varbūtības. Ja tie nav norādīti, atstājiet noklusējuma vērtības (būs līdzvērtīgi notikumi).
    Hurvica kritērijam norādiet optimisma līmeni λ. Ja nosacījumos šis parametrs nav norādīts, varat izmantot vērtības 0, 0,5 un 1.

Daudzām problēmām ir jāatrod risinājumi, izmantojot datorus. Iepriekš minētie pakalpojumi un funkcijas ir viens no rīkiem.



Jaunums vietnē

>

Populārākais