Dom Zapobieganie Matematyczna teoria gier. Przykłady nagrywania i rozwiązywania gier z życia

Matematyczna teoria gier. Przykłady nagrywania i rozwiązywania gier z życia

Jeżeli w konflikcie uczestniczy kilka stron (osób), z których każda podejmuje określoną decyzję określoną przez dany zbiór reguł i każda z osób zna ostateczny stan sytuacji konfliktowej z ustalonymi z góry dla każdej ze stron płatnościami, to gra mówi się, że ma to miejsce.

Zadaniem teorii gier jest wybranie linii zachowania danego gracza, od której odstępstwo może jedynie zmniejszyć jego wygraną.

Niektóre definicje gry

Ilościowa ocena wyników gry nazywa się płatnością.

Debel (dwie osoby) nazywa się grą o sumie zerowej, jeżeli suma wpłat wynosi zero, tj. jeśli strata jednego gracza jest równa zyskowi drugiego.

Jednoznaczny opis wyboru gracza w każdej z możliwych sytuacji, w których musi on wykonać osobisty ruch, nazywa się strategia gracza .

Strategię gracza nazywamy optymalną, jeśli przy wielokrotnym powtarzaniu gry zapewnia graczowi maksimum możliwych korzyści średnie wygrane(lub, co jest tym samym, minimalną możliwą średnią wygraną).

Gra zdefiniowana przez macierz A mający M linie i N kolumn nazywa się grą o skończonych parach wymiarów M* N;

Gdzie I=
- strategia pierwszego gracza z mstrategy; J=- strategia drugiego gracza posiadającego n strategii; ja– wygrana pierwszego gracza I-strategia, gdy jest używana przez sekundę J strategii (lub, co to jest to samo, utrata drugiej w jej strategii). J-ta strategia, jeśli zostanie użyta jako pierwsza I t);

A =  ja – matryca płatności gry.

1.1 Gra czystymi strategiami

Niska cena gry (dla pierwszego gracza)

= maks (min ja). (1.2)

I J

Najwyższa cena gry (dla drugiego gracza):

= min (maks ja) . (1.3)

J I

Jeśli = , gra nazywa się grą o punkty siodłowe (1.4) lub grą z czystymi strategiami. W której V = = nazywana cenną grą ( V- cena gry).

Przykład. Podana jest macierz płatności w grze 2-osobowej A optymalne strategie za każdego gracza i cenę gry:

(1.4)

maks 10 9 12 6

I

min 6

J

- strategia pierwszego gracza (rząd).

Strategia drugiego gracza (kolumny).

- cena gry.

Zatem gra ma punkt siodłowy. Strategia J = 4 – optymalna strategia dla drugiego gracza I=2 - dla pierwszego. Mamy grę z czystą strategią.

1.2 Gry ze strategiami mieszanymi

Jeżeli matryca płatności nie posiada punktu siodłowego, tj.
i nikt w grze nie może wybrać jednego planu jako swojej optymalnej strategii, gracze przełączają się na „strategie mieszane”. Co więcej, każdy gracz wykorzystuje każdą ze swoich strategii kilka razy w trakcie gry.

Wektor, którego każdy składnik pokazuje względną częstotliwość stosowania przez gracza odpowiedniej strategii czystej, nazywany jest strategią mieszaną tego gracza.

X= (X 1 …X I …X M) – strategia mieszana pierwszego gracza.

U= (Na 1 ...t J ...t N) – strategia mieszana drugiego gracza.

XI , j J– względne częstotliwości (prawdopodobieństwa) graczy stosujących swoje strategie.

Warunki stosowania strategii mieszanych

. (1.5)

Jeśli X* = (X 1 * ….X I*... X M*) – optymalna strategia wybrana przez pierwszego gracza; Y* = (Na 1 * …Na J*... Na N*) to optymalna strategia wybrana przez drugiego gracza, wówczas liczba oznacza koszt gry.

(1.6)

W kolejności numer V była cena gry i X* I Na* - strategie optymalne, konieczne i wystarczające do spełnienia nierówności

(1.7)

Jeśli jeden z graczy zastosuje optymalną strategię mieszaną, jego wypłata będzie równa kosztowi gry V niezależnie od częstotliwości, z jaką drugi gracz będzie korzystał ze strategii zawartych w strategii optymalnej, w tym strategii czystych.

Redukcja problemów teorii gier do problemów programowania liniowego.

Przykład. Znajdź rozwiązanie gry określonej przez macierz wypłat A.

A = (1.8)

y 1 y 2 y 3

Rozwiązanie:

Stwórzmy podwójną parę problemów programowania liniowego.

Dla pierwszego gracza

(1.9)

Na 1 +Na 2 +Na 3 = 1 (1.10)

Uwolnienie się od zmiennej V(cena gry), podziel lewą i prawą stronę wyrażeń (1.9), (1.10) na V. Po zaakceptowaniu Na J /V dla nowej zmiennej z I, otrzymujemy nowy system ograniczenia (1.11) i funkcja docelowa (1.12)

(1.11)

. (1.12)

Podobnie otrzymujemy model gry dla drugiego gracza:

(1.13)

X 1 +X 2 +X 3 = 1 . (1.14)

Redukcja modelu (1.13), (1.14) do postaci bez zmiennej V, otrzymujemy

(1.15)

, (1.16)

Gdzie
.

Jeżeli mamy określić strategię zachowania pierwszego gracza, tj. względna częstotliwość stosowania jego strategii ( X 1 ….X I …X M), użyjemy modelu drugiego gracza, ponieważ zmienne te znajdują się w jego modelu wypłat (1.13), (1.14).

Sprowadźmy (1.15), (1.16) do postaci kanonicznej

(1.17)

Ogłoszenie! Rozwiązanie Twojego konkretnego problemu będzie wyglądać podobnie do tego przykładu, włączając wszystkie tabele, teksty objaśniające i rysunki przedstawione poniżej, ale biorąc pod uwagę Twoje początkowe dane...

Zadanie:
Gra macierzowa jest dana przez następującą macierz wypłat:

Strategie „B”
Strategie „A” B 1B 2
1 3 5
2 6
3
2

Znajdź rozwiązanie gry matrix, a mianowicie:
- znajdź najwyższą cenę gry;
- Niższa cena Gry;
- cena netto gry;
- wskazać optymalne strategie graczy;
- przynieść rozwiązanie graficzne(interpretacja geometryczna), jeśli to konieczne.

Krok 1

Ustalmy niższą cenę gry – α

Najniższa cena gryα to maksymalna wygrana, jaką możemy sobie zagwarantować w grze z rozsądnym przeciwnikiem, jeśli przez całą grę zastosujemy jedną i tylko jedną strategię (strategię tę nazywamy „czystą”).

Znajdźmy w każdym wierszu matrycy płatności minimum element i zapisz go w dodatkowej kolumnie (Selected żółty patrz tabela 1).

Wtedy znajdziemy maksymalny element dodatkowej kolumny (oznaczony gwiazdką), będzie to niższa cena gry.

Tabela 1

Strategie „B”
Strategie „A” B 1B 2 Minima wierszy
1 3 5 3 *
2 6
3
2
3
2

W naszym przypadku niższa cena gry wynosi: α = 3, a żeby mieć pewność wygranej nie gorszej niż 3 musimy trzymać się strategii A 1

Krok 2

Ustalmy górną cenę gry – β

Najwyższa cena gryβ to minimalna strata, jaką gracz B może zagwarantować sobie w grze przeciwko rozsądnemu przeciwnikowi, jeśli przez całą grę zastosuje jedną i tylko jedną strategię.

Znajdźmy w każdej kolumnie matrycy płatności maksymalny element i wpisz go w dodatkowej linii poniżej (podświetlony na żółto, patrz Tabela 2).

Wtedy znajdziemy minimum element dodatkowej linii (oznaczony plusem), będzie to górna cena gry.

Tabela 2

Strategie „B”
Strategie „A” B 1B 2 Minima wierszy
1 3 5 3 *
2 6
3
2

W naszym przypadku górna cena gry wynosi: β = 5, a żeby zagwarantować sobie stratę nie większą niż 5, przeciwnik (gracz „B”) musi zastosować strategię B 2

Krok 3
Porównajmy dolną i górną cenę gry; w tym problemie różnią się one, tj. α ≠ β, macierz wypłat nie zawiera punktu siodłowego. Oznacza to, że gra nie ma rozwiązania w strategiach czystych minimax, ale zawsze ma rozwiązanie w strategiach mieszanych.

Strategia mieszana, są to czyste strategie losowo naprzemienne, z pewnymi prawdopodobieństwami (częstotliwościami).

Będziemy oznaczać strategię mieszaną gracza „A”

S A=

gdzie B 1, B 2 to strategie gracza „B”, a q 1, q 2 to odpowiednio prawdopodobieństwa zastosowania tych strategii, a q 1 + q 2 = 1.

Optymalna strategia mieszana dla gracza „A” to taka, która zapewnia mu maksymalną wypłatę. Odpowiednio, dla „B” istnieje minimalna strata. Strategie te są wyznaczone S A* i S odpowiednio B*. Rozwiązaniem gry jest para optymalnych strategii.

W przypadek ogólny Optymalna strategia gracza może nie obejmować wszystkich strategii początkowych, ale tylko niektóre z nich. Takie strategie nazywane są aktywne strategie.

Krok 4


Gdzie: P 1 , P 2 - prawdopodobieństwa (częstotliwości), z którymi stosowane są odpowiednio strategie A 1 i A 2

Z teorii gier wiadomo, że jeśli gracz „A” zastosuje swoją optymalną strategię, a gracz „B” pozostanie w ramach swoich aktywnych strategii, to średnia wypłata pozostanie niezmieniona i będzie równa kosztowi gry w niezależnie od tego, w jaki sposób gracz „B” wykorzystuje swoje aktywne strategie. I w naszym przypadku obie strategie są aktywne, w przeciwnym razie gra miałaby rozwiązanie w czystych strategiach. Zatem jeśli założymy, że gracz „B” zastosuje czystą strategię B 1, to średnia wypłata w będzie:

k 11 p 1 + k 21 p 2 = v (1)

Gdzie: k ij - elementy macierzy płatności.

Z drugiej strony, jeśli założymy, że gracz „B” zastosuje czystą strategię B 2, to średnia wypłata będzie wynosić:

k 12 p 1 + k 22 p 2 = v (2)

Zrównując lewe strony równań (1) i (2) otrzymujemy:

k 11 p 1 + k 21 p 2 = k 12 p 1 + k 22 p 2

I biorąc pod uwagę fakt, że P 1 + P 2 = 1 mamy:

k 11 p 1 + k 21 (1 - p 1 ) = k 12 p 1 + k 22 (1 - p 1 )


Gdzie łatwo jest znaleźć optymalną częstotliwość strategii A 1:
P 1 =
k 22 - k 21
k 11 + k 22 - k 12 - k 21
(3)

W tym zadaniu:

P 1 =
3
2
- 6
3 +
3
2
- 5 - 6
=
9
13

Prawdopodobieństwo R 2 znaleźć odejmując R 1 z jednostki:
P 2 = 1 - P 1 = 1 -
9
13
= + 6 ·

Gdzie: Q 1 , Q 2 - prawdopodobieństwa (częstotliwości), z którymi stosowane są odpowiednio strategie B 1 i B 2

Z teorii gier wiadomo, że jeśli gracz „B” zastosuje swoją optymalną strategię, a gracz „A” pozostanie w ramach swoich aktywnych strategii, to średnia wypłata pozostanie niezmieniona i będzie równa kosztowi gry w niezależnie od tego, w jaki sposób gracz A wykorzystuje swoje aktywne strategie. Zatem jeśli założymy, że gracz „A” zastosuje czystą strategię A 1, to średnia wypłata w będzie:

k 11 q 1 + k 12 q 2 = v (4)


Od ceny gry w już o tym wiemy i rozważamy to Q 1 + Q 2 = 1 , wówczas optymalną częstotliwość strategii B 1 można znaleźć jako:
Q 1 =
w - k 12
k 11 - k 12
(5)

W tym zadaniu:

Q 1 =
51
13
- 5
3 - 5
=
7
13

Prawdopodobieństwo Q 2 znaleźć odejmując Q 1 z jednostki:
Q 2 = 1 - Q 1 = 1 -
7
13
=
6
13

Odpowiedź:

Najniższa cena gry: α = 3
Najwyższa cena gry: β = 5
Cena gry: w =
51
13
Optymalna strategia gracza A:
S A*=
12
9
13
4
13

Optymalna strategia dla gracza „B”:
S B*=
B 1B 2
7
13
6
13

Interpretacja geometryczna (rozwiązanie graficzne):

Podajmy geometryczną interpretację rozważanej gry. Weź odcinek osi odciętych o długości jednostkowej i narysuj pionowe linie proste przez jego końce A 1 I A 2 odpowiadające naszym strategiom A 1 i A 2 . Załóżmy teraz, że gracz „B” zastosuje strategię B 1 in czysta forma. Następnie, jeśli my (gracz „A”) zastosujemy czystą strategię A 1, to nasza wypłata wyniesie 3. Zaznaczmy odpowiedni punkt na osi A 1 .
Jeśli zastosujemy czystą strategię A 2, to nasza wypłata wyniesie 6. Zaznaczmy odpowiedni punkt na osi A 2
(Patrz rys. 1). Oczywiście jeśli zastosujemy mieszając strategie A 1 i A 2 w różnych proporcjach, nasze wygrane będą się zmieniać wzdłuż linii prostej przechodzącej przez punkty o współrzędnych (0, 3) i (1, 6), nazwijmy to linią strategii B 1 (na rys. 1 zaznaczono na czerwono). Odcięta dowolnego punktu na danej linii jest równa prawdopodobieństwu P 2 (częstotliwość), z jaką stosujemy strategię A 2, oraz rzędną - uzyskany zysk k (patrz ryc. 1).

Obrazek 1.
Wykres wypłat k od częstotliwości str. 2 , gdy wróg korzysta ze strategii B 1.

Załóżmy teraz, że gracz „B” zastosuje strategię B 2 w jej czystej postaci. Następnie, jeśli my (gracz „A”) zastosujemy czystą strategię A 1, wówczas nasza wypłata wyniesie 5. Jeśli zastosujemy czystą strategię A 2, wówczas nasza wypłata wyniesie 3/2 (patrz rys. 2). Podobnie, jeśli zmieszamy strategie A 1 i A 2 w różnych proporcjach, nasze wygrane będą się zmieniać wzdłuż linii prostej przechodzącej przez punkty o współrzędnych (0, 5) i (1, 3/2), nazwijmy to linią strategii B 2. Podobnie jak w poprzednim przypadku, odcięta dowolnego punktu na tej prostej jest równa prawdopodobieństwu, z jakim zastosujemy strategię A 2, a rzędną jest wynikowy zysk, ale tylko dla strategii B 2 (patrz ryc. 2).

Rysunek 2.
w i optymalna częstotliwość str. 2 dla gracza "A".

W prawdziwej grze, gdy rozsądny gracz „B” wykorzysta wszystkie swoje strategie, nasza wygrana będzie się zmieniać wzdłuż przerywanej linii pokazanej na ryc. 2 na czerwono. Linia ta definiuje tzw dolny limit wygranych. Oczywiście, że najbardziej wysoka temperatura ta linia przerywana odpowiada naszej optymalnej strategii. W w tym przypadku, jest to punkt przecięcia linii strategii B 1 i B 2. Należy pamiętać, że jeśli wybierzesz częstotliwość P 2 równy jej odciętej, wówczas nasz zysk pozostanie niezmieniony i równy w dla dowolnej strategii gracza „B”, dodatkowo będzie to maksimum, jakie możemy sobie zagwarantować. Częstotliwość (prawdopodobieństwo) P 2 w tym przypadku jest odpowiednią częstotliwością naszej optymalnej strategii mieszanej. Nawiasem mówiąc, na rysunku 2 widać częstotliwość P 1 , naszą optymalną strategią mieszaną, jest długość segmentu [ P 2 ; 1] na osi odciętych. (To dlatego, że P 1 + P 2 = 1 )

Stosując zupełnie podobne rozumowanie, możemy znaleźć częstości występowania optymalnej strategii dla gracza „B”, co ilustruje rysunek 3.

Rysunek 3.
Graficzne określenie ceny gry w i optymalna częstotliwość q 2 dla gracza "W".

Tylko dla niego powinien być tzw Górna granica przegrywający(czerwona linia przerywana) i poszukaj na niej najniższego punktu, ponieważ dla gracza „B” celem jest minimalizacja strat. Ta sama wartość częstotliwości Q 1 , jest to długość odcinka [ Q 2 ; 1] na osi x.

Spis treści 1 Informacje ogólne 2 1.1 Gry. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Ruchy. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 Strategie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 Gra Matrix. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 Punkt szlaku. Strategie czyste 7 2.1 Przykłady. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Przykład 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Przykład 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 Strategie mieszane 9 3.1 Gra 2×2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1 Przykłady. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Przykład 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Przykład 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.2 Interpretacja geometryczna. . . . . . . . . . . . . . . . . . . . 12 3.2 Gry 2×n i m×2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 Przykład 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1 1. Informacje ogólne z teorii gier 1.1. Gry Teoria gier to matematyczna teoria sytuacji konfliktowych, tj. sytuacje, w których kolidują interesy dwóch lub więcej stron realizujących różne cele. Gra to sytuacja konfliktowa regulowana pewnymi regułami, które muszą wskazywać: możliwe opcje działań uczestników; ilościowy wynik gry lub płatności (wygrana, przegrana), do którego prowadzi dany zestaw ruchów; każdej ze stron na temat zachowania drugiej. Gra podwójna to gra, w której biorą udział tylko dwie strony (dwóch graczy). Gra parami o sumie zerowej to gra parami, w której suma wpłat wynosi zero, tj. Strata jednego gracza równa się zyskowi drugiego. W zależności od stosunku każdego gracza do wartości funkcji wypłaty, gry parowe dzielą się na: Gra parowa o sumie zerowej (antagonistyczna) - gra parowa, w której wysokość wpłat jest równa zeru, tj. Strata jednego gracza równa się zyskowi drugiego. Gra nieantagonistyczna to gra w parach, w której gracze dążą do różnych, ale nie bezpośrednio przeciwnych celów. 2 1.2. Ruchy Ruch - wybór jednej z akcji przewidzianych przez reguły gry. Realizacja tego wyboru. Ruchy są dwojakiego rodzaju: Ruch osobisty - + świadomy wybór jednej z akcji przewidzianych przez reguły gry + realizacja; tego wyboru Losowy ruch - Losowy ruch to wybór spośród szeregu możliwości, dokonywany nie na podstawie decyzji gracza, ale przez jakiś mechanizm losowego wyboru. Poniżej rozważamy gry w parach o sumie zerowej, zawierające wyłącznie ruchy osobiste. Każdej ze stron brakuje informacji o zachowaniu drugiej. 3 1.3. Strategie Strategia gracza to zbiór zasad, które określają wybór akcji dla każdego osobistego ruchu tego gracza, w zależności od sytuacji, która pojawi się w trakcie gry. W zależności od liczby możliwych strategii gry dzielą się na skończone i nieskończone. Gra nieskończona to gra, w której uczestniczy co najmniej jeden z graczy nieskończona liczba strategie. Gra skończona to gra, w której każdy gracz ma tylko skończoną liczbę strategii. Liczba kolejnych ruchów dowolnego gracza określa podział partii na jednoruchowe i wieloruchowe, czyli pozycyjne. + W grze składającej się z jednej tury każdy gracz dokonuje tylko jednego wyboru spośród możliwych opcji, a następnie ustala wynik gry. + Gra wieloruchowa lub pozycyjna rozwija się z czasem, reprezentując serię kolejne etapy, z których każdy następuje po ruchu jednego z graczy i odpowiadającej mu zmianie sytuacji. W grze składającej się z jednej tury każdy gracz dokonuje tylko jednego wyboru możliwe opcje a następnie decyduje o wyniku gry. Optymalna strategia gracza to strategia, która przy wielokrotnym powtarzaniu gry zapewnia temu graczowi maksymalną możliwą średnią wygraną (lub co za tym idzie minimalną możliwą średnią stratę). W teorii gier wszystkie rekomendacje opierają się na założeniu rozsądnego zachowania graczy. W teorii gier nie uwzględnia się błędnych obliczeń i błędów graczy, nieuniknionych w każdej sytuacji konfliktowej, a także elementów emocji i ryzyka. 4 1.4. Gra macierzowa Gra macierzowa jest grą o skończonej sumie zerowej, składającą się z jednego ruchu. Gra macierzowa jest grą teoretyczną model gry sytuacja konfliktowa, w której przeciwnicy, aby osiągnąć diametralnie przeciwne cele, dokonują jednego wyboru (ruchu) ze skończonej liczby możliwe sposoby działania. Zgodnie z wybranymi sposobami działania (strategiami) określany jest osiągnięty wynik. Spójrzmy na przykład. Niech będzie dwóch graczy A i B, z których jeden może dokonać wyboru i-ta strategia spośród m swoich możliwych strategii A1, A2, ...Am, a drugi wybiera j-tą strategię spośród swoich możliwych strategii B1, B2, ...Bm. W rezultacie pierwszy gracz zdobywa wartość aij, a drugi gracz traci tę wartość. Z liczb aij tworzymy macierz   a11 a11 · · · a1n  a21 a22 · · · a2n    A = (aij) =  .. .. ..   . . . .  am1 am2 · · · amn Macierz A = (aij), i = 1, m, j = 1, n nazywana jest macierzą wypłat lub macierzą gry m × n. W tej macierzy wiersze dotyczą zawsze strategii zwycięskiego (maksymalizującego) gracza A, czyli gracza, który dąży do maksymalizacji swoich wygranych. Kolumny przypisane są do strategii przegrywającego gracza B, czyli gracza, który dąży do minimalizacji kryterium efektywności. Normalizacja gry to proces sprowadzania gry pozycyjnej do gry macierzowej. Gra w postaci normalnej jest grą pozycyjną zredukowaną do gry macierzowej. Przypomnijmy, że gra pozycyjna z wieloma ruchami jest teoretycznym modelem gry sytuacja konfliktowa, w której przeciwnicy po kolei dokonują jednego wyboru (ruchu) ze skończonej liczby możliwych kierunków działania na każdym etapie rozwoju tej sytuacji. Rozwiązaniem gry jest znalezienie optymalnej strategii obu graczy i ustalenie ceny gry. Ceną gry jest oczekiwany zysk (strata) graczy. Rozwiązanie tej gry można znaleźć albo w strategiach czystych – gdy gracz musi zastosować jedną, pojedynczą strategię, albo w strategiach mieszanych, gdy gracz musi zastosować dwie lub więcej czystych strategii z określonym prawdopodobieństwem. Te ostatnie w tym przypadku nazywane są aktywnymi. 5 Strategia mieszana jednego gracza to wektor, którego każdy składnik pokazuje częstotliwość stosowania przez gracza odpowiedniej strategii czystej. Maximin lub niższa cena gry - liczba α = max min aij i j Strategia Maximin (linia) - strategia, którą wybrał gracz, aby zmaksymalizować swoje minimalne wygrane. Oczywiście, wybierając najbardziej ostrożną strategię maximin, gracz A zapewnia sobie (niezależnie od zachowania przeciwnika) gwarantowaną wypłatę co najmniej α. Maximin czyli górna cena gry - liczba β = min max aij j i Strategia Minimax (kolumna) - strategia, którą wybrał gracz, aby zminimalizować swoją maksymalną stratę. Oczywiście, wybierając najbardziej ostrożną strategię minimax, gracz B w żadnym wypadku nie pozwala graczowi A wygrać więcej niż β. Niższa cena gry nie zawsze przekracza górną cenę gry α = max min aij 6 min max aij = β i j j i Twierdzenie 1 (główne twierdzenie teorii gier macierzowych). Każda skończona gra ma co najmniej jedno rozwiązanie, prawdopodobnie w dziedzinie strategii mieszanych. 6 2. Gry z punktem siodłowym. Rozwiązanie w strategiach czystych Gra z punktem siodłowym to gra, dla której α = max min aij = min max aij = β i j j i W przypadku gier z punktem siodłowym znalezienie rozwiązania polega na wyborze optymalnych strategii maximin i minimax., Pure koszt gry – Ogólne znaczenie dolna i górna cena gry α=β=ν 2.1. Przykłady Przykład 1 Znajdź rozwiązanie w czystych strategiach gry podanych przez macierz   8 4 7 A= 6 5 9  7 7 8 Rozwiązanie: określ górną i dolną cenę gry. Aby to zrobić, znajdujemy minimum liczb aij in i-ta linia αi = min aij j oraz maksimum liczb aij w j-tej kolumnie βj = max aij i Liczby αi (minima wiersza) zapisujemy obok macierzy płatności po prawej stronie w formie dodatkowej kolumny. Liczby βi (maksyma kolumny) zapisujemy pod macierzą w postaci dodatkowej linii: αi 8 4 7 4 6 5 9 5 7 7 8 7 βj 8 7 9 7 Znajdź maksimum liczb αi α = max αi = 7 i oraz minimum liczb βj β = min βj = 7 j α = β – gra ma punkt siodłowy. Optymalną strategią dla gracza jest strategia A3, a dla gracza B strategia B2, cena gry netto ν = 7 Przykład 2 Dana jest macierz płatności:   2 2 1 1 2  0 1 1 1 1  A=  1 1 1 1 2   1 2 1 1 2 Znajdź rozwiązanie gry w czystych strategiach. Rozwiązanie: 2 2 1 1 2 1 0 1 1 1 1 0 1 1 1 1 2 1 1 2 1 1 2 1 βj 2 2 1 1 2 α = β = 1. Gra ma sześć punktów siodłowych. Optymalnymi strategiami będą: A1 i B3 lub B4 A3 i B3 lub B4 A4 i B3 lub B4 8 3. Rozwiązanie gry w strategiach mieszanych Gdy α = β. W przypadku, gdy przy wyborze swoich strategii obaj gracze nie mają informacji o wyborze drugiej, gra ma rozwiązanie w strategiach mieszanych. SA = (p1, p2, ..., pm) - strategia mieszana gracza A, w której stosowane są strategie A1, A2, ..., Am z prawdopodobieństwami ∑ m p1, p2, ..., pm, pi = 1, pi > 0, i = 1, m i=1 SB = (q1, q2, ..., qn) - strategia mieszana gracza B, w której stosowane są strategie B1, B2, ..., Bm z prawdopodobieństwem ∑ n q1, q2 , ..., qm , qi = 1, qi > 0, i = 1, n i=1 Jeśli: SA∗ jest optymalną strategią gracza A, SB∗ jest optymalną strategią gracza B, to koszt gry wynosi ∑ n ∑ m ν = aij · p∗i · qi∗ j=1 i=1 Poniższe twierdzenie odpowiada na pytanie, jak znaleźć rozwiązanie dla gier 2 × 2, 2 × n, m × 2 Twierdzenie 2 (jak znaleźć rozwiązanie dla gier 2 × 2, 2 × n, m × 2). Jeżeli jeden z graczy zastosuje optymalną strategię mieszaną, to jego wypłata będzie równa kosztowi gry ν, niezależnie od prawdopodobieństwa, z jakim drugi gracz zastosuje strategie zawarte w strategii optymalnej (w tym strategie czyste). 9 3.1. Gra 2 × 2 Rozważmy grę 2 × 2 z macierzą: () a11 a21 a21 a22 Niech gra nie ma rozwiązania w czystych strategiach. Znajdźmy optymalne strategie SA∗ i SB∗. Najpierw definiujemy strategię SA∗ = (p∗1 , p∗2). Zgodnie z twierdzeniem, jeśli strona A będzie trzymać się strategii ν, to niezależnie od kierunku działania strony B, wypłata pozostanie równa kosztowi gry ν. W konsekwencji, jeśli strona A zastosuje optymalną strategię SA∗ = (p∗1 , p∗2), to strona B może zastosować dowolną ze swoich strategii bez zmiany swojej wypłaty. Następnie, gdy gracz B zastosuje czystą strategię B1 lub B2, otrzyma średnią wypłatę równą kosztowi gry: a11 p∗1 + a21 p∗2 = ν ← dla strategii B1 a12 p∗1 + a22 p∗ 2 = ν ← dla strategii B2 Biorąc pod uwagę, że p∗1 + p∗2 = 1: p∗1 = a2 2−a2 1 a11 +a22 −a12 −a21 p∗2 = a1 1−a1 2 a11 +a22 −a12 −a21 Cena gry: a22 a11 − a12 a21 ν= a11 + a22 − a12 − a21 W podobny sposób można znaleźć optymalną strategię gracza B: SB∗ = (q1∗ , q2∗). Biorąc pod uwagę, że q1∗ + q2∗ = 1: q1∗ = a2 2−a1 2 a11 +a22 −a12 −a21 q2∗ = a1 1−a2 1 a11 +a22 −a12 −a21 3.1.1. Przykłady Przykład 3 Znajdź rozwiązanie gry z macierzą () −1 1 A= 1 −1 10 Rozwiązanie: gra nie ma punktu siodłowego, ponieważ α= -1, β = 1, α ̸= β. Rozwiązania szukamy w strategiach mieszanych. Korzystając ze wzorów na p∗ i q∗ otrzymujemy p∗1 = p∗2 = 0,5 i q1∗ = q2∗ = 0,5, ν = 0 Zatem SA∗ = (0,5, 0,5) SB∗ = (0,5, 0,5 ) Przykład 4 Znajdź rozwiązanie gry z macierzą () 2 5 A= 6 4 Rozwiązanie: gra nie ma punktu siodłowego, gdyż α= 4, β = 5, α ̸= β. Rozwiązania szukamy w strategiach mieszanych. Korzystając ze wzorów na p∗ i q∗ otrzymujemy p∗1 = 0,4, p∗2 = 0,6 i q1∗ = 0,2 q2∗ = 0,8, ν = 4,4 Zatem SA∗ = (0,4, 0,6) SB∗ = ( 0,2, 0,8) 11 3.1.2. Interpretacja geometryczna Gra 2 × 2 może mieć prostą interpretację geometryczną. Weźmy pojedynczy odcinek osi odciętych, którego każdy punkt kojarzymy z jakąś strategią mieszaną S = (p1, p2) = (p1, 1 − p1) i prawdopodobieństwo p1 strategii A1 będzie równe odległości od punkt SA na prawy koniec przekroju i prawdopodobieństwo p2 , strategia A2 - odległość do lewego końca. .y .I .I I .B1′ .N .B1 .a21 .a11 .I I .I .∗ .x .P2 .SA∗ .P1∗ W szczególności lewy koniec przekroju (punkt z odciętą = 0) odpowiada do strategii A1, prawy koniec odcinka (x = 1) - strategia A2 Na końcach odcinka przywracane są dwie prostopadłe do osi x: oś I − I – wypłata dla strategii A1 zostaje odroczona; II - wypłata dla strategii A2 zostaje przełożona. Niech gracz B zastosuje strategię B1; daje na osiach odpowiednio I – I i II – II punkty o rzędnych a11 i a21. Przez te punkty rysujemy linię prostą B1 − B1′. Dla dowolnej strategii mieszanej SA = (p1, p2) wypłatę gracza wyznacza punkt N na prostej B1 − B1′, odpowiadający punktowi SA na osi x dzielącej odcinek w stosunku p2: p1. Oczywiście linię prostą B2 − B2′, która wyznacza wypłatę dla strategii B2, można skonstruować dokładnie w ten sam sposób. 12 .y .I .I I .B2 .N .a21 .B2′ a . 22 .I I .I .∗ .x .P2 .SA∗ .P1∗ Należy znaleźć optymalną strategię SA∗ , tj. w taki sposób, że minimalna wypłata gracza A (biorąc pod uwagę najgorsze zachowanie gracza B) zamieniła się w maksymalną. Aby to zrobić, skonstruuj dolną granicę wypłaty gracza A dla strategii B1, B2, tj. linia przerywana B1 N B2′ ;. Na tej granicy będzie znajdować się minimalna wypłata gracza A dla dowolnej jego strategii mieszanej, punkt N, w którym wypłata ta osiąga maksimum i określa decyzję oraz cenę gry. .y .I .I I .B2 .B1′ .N .B1 .B2′ .I I .I .∗ .x .P2 . A∗ S. 1∗ P Współrzędna punktu N to nic innego jak koszt gry ν, jego odcięta wynosi ∗2, a odległość do prawego końca odcinka wynosi ∗1, tj. odległości punktu SA∗ do końców odcinka są równe prawdopodobieństwom ∗2 i ∗1 strategii A2 i A1 optymalnej strategii mieszanej gracza A. w tym przypadku o rozwiązaniu gry zadecydowała punkt przecięcia strategii B1 i B2. Poniżej przedstawiono przypadek, w którym optymalną strategią gracza jest czysta strategia A2. Tutaj strategia A2 (dla dowolnej strategii wroga) jest bardziej opłacalna niż strategia A1, 13 .y .y .I .I I .I I. I .B2′ . 1′ B .B1′ B . 2 .B2′ B . 2 .B1 .ν = a21 .B1 .ν = a21 I. I I. I .I . .x.I . .X. 2∗ P. A∗S = A2. 2∗ P. A∗ S = A2 Po prawej stronie przedstawiono przypadek, gdy gracz B ma oczywiście nieopłacalną strategię. Interpretacja geometryczna pozwala również zobrazować niższą cenę gry α i wyższą cenę β .y .I .I I .B2. .B1′ .N .B1 .B2′ .β = a21 .α = a22 .I I .I .∗ .x .P2 . A∗ S. 1∗ P Na tym samym wykresie możemy także podać interpretację geometryczną optymalnych strategii gracza B. Łatwo sprawdzić, że udział q1∗ strategii B1 w optymalnej strategii mieszanej SB∗ = (q1∗ , q2∗) jest równy stosunkowi długości odcinka KB2 do sumy długości odcinków KB1 oraz KB2 na osi I – I: .y .I .I I .B2 .N .K .L .B1 .B2′ .I I .I .∗ .x .P2 . A∗ S. 1∗ P 14 KB2 q1∗ = KB2 + KB1 lub LB2′ q1∗ = LB2′ + LB1′ Optymalną strategię SB∗ = (q1∗ , q2∗) można znaleźć w inny sposób, zamieniając graczy B i B, i zamiast maksimum dolnego limitu wygranych, rozważ minimum górnego limitu. .y .I .I I .A2 .A′1 .N .A1 .A′2 .I I .I . .x .q2∗ . B∗ S .q1∗ 15 3.2. Gry 2 × n i m × 2 Rozwiązanie gier 2 × n i m × 2 opiera się na następującym twierdzeniu. Twierdzenie 3. Każda skończona gra m × n ma rozwiązanie, w którym liczba aktywnych strategii każdej ze stron nie przekracza najmniejszej z liczb m i n. Zgodnie z tym twierdzeniem gra 2 × n zawsze ma rozwiązanie, w którym każdy gracz ma co najwyżej dwie aktywne strategie. Po znalezieniu tych strategii gra 2 × n zamienia się w grę 2 × 2, którą można rozwiązać w elementarny sposób. Wyszukiwanie aktywnych strategii można przeprowadzić graficznie: 1) konstruuje się interpretację graficzną; 2) ustala się dolną granicę wygranej; 3) przy dolnej granicy wypłaty identyfikowane są dwie strategie drugiego gracza, które odpowiadają dwóm liniom przecinającym się w punkcie o maksymalnej rzędnej (jeśli w tym punkcie przecinają się więcej niż dwie linie, wybierana jest dowolna para) – strategie te reprezentują aktywne strategie gracza B. Zatem gra 2 × n sprowadza się do gry 2 × 2. Gra m × 2 również może zostać rozwiązana, z tą różnicą, że nie dolna, ale górna granica wypłaty wynosi skonstruowany, a nie maksimum, ale szuka się na nim minimum. Przykład 5 Znajdź rozwiązanie gry () 7 9 8 A= 10 6 9 Rozwiązanie: stosując metodę geometryczną dobieramy strategie aktywne. Linie bezpośrednie B1 – B1′, B2 – B2′ i B3 – B3′ odpowiadają strategiom B1, B2, B3. Linia przerywana B1 N B2 to dolna granica wygranej gracza. Gra ma rozwiązanie S∗A = (23, 31); S∗B = (0,5; 0,5; 0); v = 8. 16 .y .I .I Ja . 1′ B. B. 2 .B3′ .N .B3 .B1 .B2′ .I I .I . .X. 2∗ P. A∗ S. 1∗ P 17 Gra indeksowa, 2 ruchy, 3 2 × 2, 10 osobiste, 3 2 × 2, 9 losowe, 3 geometria, 12 cena gry netto, 7 przykładów, 10 2 × n, 9, 16 m × 2, 9 , 16 nieskończonych, 4 w postaci normalnej, 5 skończonych, 4 wieloruchowych, 4 jednoruchowych, 4 macierzowych, 5 parowych, 2 o sumie zerowej, 2 antagonistycznych, 2 nieantagonistycznych, 2 rozwiązań, 5 w strategiach mieszanych, 5 , 9 w strategiach czystych, 5 z punktem siodłowym, 7 cena, 5 górna, 6 dolna, 6 czysta, 7 maximin, 6 gra matrix, 5 wypłata, 5 minimax, 6 normalizacja gry, 5 strategia, 4 maximin, 6 minimax, 6 optymalna, 4 mieszana, 5 teoria gier, 2 18

Z popularnego amerykańskiego bloga Cracked.

Teoria gier polega na badaniu sposobów wykonania najlepszego ruchu i w rezultacie zdobycia jak największej części zwycięskiego tortu, odcinając jego część innym graczom. Uczy analizowania wielu czynników i wyciągania logicznie wyważonych wniosków. Myślę, że należy się tego uczyć po liczbach, a przed alfabetem. Po prostu dlatego, że zbyt wiele osób podejmuje ważne decyzje w oparciu o intuicję, tajne proroctwa, położenie gwiazd i tym podobne. Dokładnie przestudiowałem teorię gier i teraz chcę opowiedzieć Ci o jej podstawach. Być może doda to trochę zdrowego rozsądku do Twojego życia.

1. Dylemat więźnia

Berto i Robert zostali aresztowani za napad na bank po tym, jak nie wykorzystali odpowiednio skradzionego samochodu do ucieczki. Policja nie jest w stanie udowodnić, że to oni napadli na bank, ale przyłapała ich na gorącym uczynku w skradzionym samochodzie. Zabrano ich do różnych pomieszczeń i każdemu zaproponowano układ: wydać wspólnika i wysłać go do więzienia na 10 lat, a sam zostać zwolniony. Ale jeśli obaj się zdradzą, każdy otrzyma 7 lat. Jeśli nikt nic nie powie, obaj pójdą do więzienia na 2 lata za kradzież samochodu.

Okazuje się, że jeśli Berto będzie milczał, ale Robert go wyda, Berto trafi do więzienia na 10 lat, a Robert wyjdzie na wolność.

Każdy więzień jest graczem i korzyści dla wszystkich można wyrazić w formie „formuły” (co dostają obaj, co dostaje drugi). Na przykład, jeśli cię uderzę, mój wzór zwycięstwa będzie wyglądał następująco (mam brutalne zwycięstwo, przez które cierpisz silny ból). Ponieważ każdy więzień ma dwie możliwości, wyniki możemy przedstawić w tabeli.

Zastosowanie praktyczne: Identyfikacja socjopatów

Tutaj widzimy główne zastosowanie teorii gier: identyfikowanie socjopatów, którzy myślą tylko o sobie. Prawdziwa teoria gier to potężne narzędzie analityczne, a amatorstwo często służy jako czerwona flaga sygnalizująca kogoś, kto nie ma poczucia honoru. Osoby dokonujące intuicyjnych obliczeń uważają, że lepiej zrobić coś brzydkiego, bo zaowocuje to krótszym wyrokiem więzienia, niezależnie od tego, co zrobi drugi gracz. Technicznie rzecz biorąc, jest to poprawne, ale tylko wtedy, gdy jesteś krótkowzroczną osobą, która stawia wyższe liczby życie ludzkie. Właśnie dlatego teoria gier jest tak popularna w finansach.

Prawdziwym problemem dylematu więźnia jest to, że ignoruje on dane. Nie uwzględnia na przykład możliwości spotkania się z przyjaciółmi, krewnymi, a nawet wierzycielami osoby, którą skazałeś na 10 lat więzienia.

Najgorsze jest to, że wszyscy zaangażowani w dylemat więźnia zachowują się tak, jakby nigdy o nim nie słyszeli.

A najlepszym posunięciem jest milczeć i po dwóch latach wspólnie z dobrym przyjacielem wykorzystać te same pieniądze.

2. Strategia dominująca

To jest sytuacja, w której Twoje działania dają największa wygrana niezależnie od działań przeciwnika. Nieważne, co się stanie, zrobiłeś wszystko dobrze. Dlatego wiele osób cierpiących na dylemat więźnia wierzy, że zdrada prowadzi do „najlepszego” wyniku niezależnie od tego, co zrobi druga osoba, a nieznajomość rzeczywistości tkwiąca w tej metodzie sprawia, że ​​wydaje się to niezwykle łatwe.

Większość gier, w które gramy, nie ma ściśle dominujących strategii, ponieważ w przeciwnym razie byłyby okropne. Wyobraź sobie, że zawsze robiłeś to samo. W grze papier-kamień-nożyce nie ma dominującej strategii. Ale jeśli grałeś z osobą, która miała na sobie rękawice kuchenne i mogła pokazywać tylko kamień lub papier, miałbyś dominującą strategię: papier. Twój papier owinie jego kamień lub zakończy się remisem, a ty nie możesz przegrać, ponieważ twój przeciwnik nie może pokazać nożyczek. Teraz, gdy masz już strategię dominującą, głupcem byłoby spróbować czegoś innego.

3. Walka płci

Gry są ciekawsze, gdy nie mają ściśle dominującej strategii. Na przykład walka płci. Anjali i Borislav idą na randkę, ale nie mogą wybierać między baletem a boksem. Anjali uwielbia boks, ponieważ lubi widzieć krew płynącą ku uciesze wrzeszczącego tłumu widzów, którzy myślą, że są cywilizowani tylko dlatego, że zapłacili za zmiażdżenie komuś głowy.

Borislav chce oglądać balet, bo rozumie, przez co przechodzą baletnice wielka ilość kontuzje i najcięższy trening, wiedząc, że jedna kontuzja może zakończyć wszystko. Tancerze baletu - najwięksi sportowcy na ziemi. Baletnica może kopnąć Cię w głowę, ale nigdy tego nie zrobi, bo jej noga jest warta znacznie więcej niż Twoja twarz.

Każdy z nich chce wybrać się na swoje ulubione wydarzenie, ale nie chce bawić się nim samotnie, więc oto jak wygrywają: najwyższa wartość- robić to, co im się podoba, najmniejsza wartość- po prostu bycie z drugą osobą i zero - bycie samemu.

Niektórzy sugerują uparte manewrowanie na krawędzi: jeśli bez względu na wszystko zrobisz, co chcesz, druga osoba będzie musiała dostosować się do twojego wyboru, bo inaczej wszystko straci. Jak już mówiłem, uproszczona teoria gier świetnie radzi sobie z identyfikowaniem głupców.

Praktyczne zastosowanie: Unikaj ostrych narożników

Oczywiście strategia ta ma również swoje istotne wady. Po pierwsze, jeśli potraktujesz swoje randki jako „walkę płci”, to nie zadziała. Rozstańcie się, żeby każdy z was mógł znaleźć kogoś, kto mu się spodoba. Drugi problem polega na tym, że w tej sytuacji uczestnicy są na tyle niepewni siebie, że nie mogą tego zrobić.

Prawdziwie zwycięską strategią dla każdego jest robienie tego, co chce. a potem lub następnego dnia, kiedy będą już wolni, idźcie razem do kawiarni. Lub na zmianę boks i balet, aż w świecie rozrywki nastąpi rewolucja i wynalezienie baletu bokserskiego.

4. Równowaga Nasha

Równowaga Nasha to zestaw ruchów, w przypadku których po fakcie nikt nie chce zrobić niczego inaczej. A jeśli uda nam się sprawić, że to zadziała, teoria gier zastąpi cały system filozoficzny, religijny i finansowy na planecie, ponieważ „wola nie zbankrutowania” stała się dla ludzkości silniejsza siła napędowa niż ogień.

Podzielmy szybko 100 dolarów. Ty i ja decydujemy, ile z setek potrzebujemy i jednocześnie ogłaszamy kwoty. Jeśli nasz całkowita kwota mniej niż sto, każdy dostaje to, czego chciał. Jeśli całkowity więcej niż sto, ten, który poprosił o najmniejszą kwotę, otrzymuje żądaną kwotę, a bardziej chciwy dostaje to, co zostało. Jeśli poprosimy o tę samą kwotę, każdy dostanie 50 dolarów. Ile poprosisz? Jak podzielisz pieniądze? Jest tylko jeden zwycięski ruch.

Odbierając 51 dolarów, otrzymasz pieniądze maksymalna ilość bez względu na to, co wybierze twój przeciwnik. Jeśli poprosi o więcej, otrzymasz 51 dolarów. Jeśli poprosi o 50 lub 51 dolarów, otrzymasz 50 dolarów. A jeśli poprosi o mniej niż 50 dolarów, otrzymasz 51 dolarów. Tak czy inaczej, nie ma innej opcji, która pozwoli Ci zarobić więcej pieniędzy niż ta. Równowaga Nasha – sytuacja, w której oboje wybieramy 51 dolarów.

Praktyczne zastosowanie: najpierw pomyśl

Oto cały sens teorii gier. Nie musisz wygrywać, a tym bardziej szkodzić innym graczom, ale musisz wykonać najlepszy dla siebie ruch, niezależnie od tego, co szykują dla ciebie otaczający cię ludzie. A jeszcze lepiej, jeśli ten ruch będzie korzystny dla innych graczy. To jest ten rodzaj matematyki, który może zmienić społeczeństwo.

Ciekawą odmianą tego pomysłu jest picie, które można nazwać zależną od czasu równowagą Nasha. Kiedy wypijesz wystarczająco dużo, nie przejmujesz się zachowaniem innych ludzi, niezależnie od tego, co robią, ale następnego dnia naprawdę żałujesz, że nie zrobiłeś czegoś inaczej.

5. Gra w rzuty

Losowanie odbywa się pomiędzy Graczem 1 i Graczem 2. Każdy gracz jednocześnie wybiera orzeł lub reszkę. Jeśli odgadnie poprawnie, Gracz 1 otrzymuje grosz Gracza 2. Jeśli nie, Gracz 2 otrzymuje monetę Gracza 1.

Zwycięska macierz jest prosta...

...optymalna strategia: graj całkowicie losowo. To trudniejsze niż myślisz, ponieważ wybór musi być całkowicie losowy. Jeśli preferujesz orzeł lub reszkę, Twój przeciwnik może to wykorzystać, aby zabrać Twoje pieniądze.

Oczywiście prawdziwym problemem jest to, że byłoby znacznie lepiej, gdyby po prostu rzucili się na siebie po jednym groszu. W rezultacie ich zyski byłyby takie same, a wynikająca z tego trauma mogła pomóc tym nieszczęśnikom poczuć coś innego niż straszliwą nudę. Po tym wszystkim, to najgorsza gra kiedykolwiek istniejąca. I to jest idealny model do rzutów karnych.

Zastosowanie praktyczne: Kara

W piłce nożnej, hokeju i wielu innych grach dogrywka to rzuty karne. I byłyby bardziej interesujące, gdyby opierały się na liczbie graczy pełna forma potrafiliby zrobić koło od wozu, ponieważ świadczyłoby to przynajmniej o ich zdolnościach fizycznych i byłoby fajnie je oglądać. Bramkarze nie są w stanie jednoznacznie określić ruchu piłki czy krążka już na samym początku jego ruchu, bo niestety roboty w dalszym ciągu nie biorą udziału w naszych zmaganiach sportowych. Bramkarz musi wybrać kierunek w lewo lub w prawo i mieć nadzieję, że jego wybór będzie zgodny z wyborem przeciwnika kopiącego bramkę. Ma to coś wspólnego z grą monetami.

Należy jednak pamiętać, że nie jest to doskonały przykład podobieństwa do gry orzeł i reszka, bo nawet jeśli dokonanie właściwego wyboru kierunku, bramkarz nie może złapać piłki, a atakujący nie może trafić do bramki.

Jaki jest zatem nasz wniosek zgodnie z teorią gier? Gry z piłką powinny kończyć się w sposób „multi-ball”, w którym co minutę gracze grający w trybie jeden na jednego otrzymują dodatkową piłkę/krążek, dopóki jedna ze stron nie osiągnie określonego wyniku, co świadczy o prawdziwych umiejętnościach zawodników, oraz nie jest to spektakularny przypadkowy zbieg okoliczności.

Ostatecznie należy zastosować teorię gier, aby uczynić grę mądrzejszą. Co oznacza, że ​​jest lepiej.

Teoria gry jako gałąź badań operacyjnych, jest teorią modeli matematycznych umożliwiających podejmowanie optymalnych decyzji w warunkach niepewności lub konfliktu kilku stron o różnych interesach. Teoria gier bada optymalne strategie w sytuacjach związanych z grami. Należą do nich sytuacje związane z wyborem najbardziej opłacalnych rozwiązań produkcyjnych dla systemu eksperymentów naukowych i ekonomicznych organizacji kontrola statystyczna, powiązania gospodarcze pomiędzy przedsiębiorstwami przemysłowymi a innymi sektorami. Formalizacja sytuacje konfliktowe matematycznie można je przedstawić jako grę dwóch, trzech itd. graczy, z których każdy dąży do maksymalizacji swoich korzyści, swoich wygranych kosztem drugiego.

Sekcja „Teoria gier” jest reprezentowana przez trzy kalkulatory internetowe:

  1. Optymalne strategie graczy. W takich problemach określona jest macierz płatności. Wymagane jest znalezienie czystych lub mieszanych strategii graczy i, cena gry. Aby rozwiązać, należy określić wymiar macierzy i metodę rozwiązania. Usługa wdraża następujące metody rozwiązania dla gry dwuosobowej:
    1. Minimaks. Jeśli chcesz znaleźć czystą strategię graczy lub odpowiedzieć na pytanie dotyczące punktu siodłowego gry, wybierz tę metodę rozwiązania.
    2. Metoda Simplex. Służy do rozwiązywania mieszanych gier strategicznych z wykorzystaniem metod programowania liniowego.
    3. Metoda graficzna. Służy do rozwiązywania mieszanych gier strategicznych. Jeśli istnieje punkt siodłowy, rozwiązanie zostaje zatrzymane. Przykład: Dla danej macierzy płatności znajdź optymalne strategie mieszane graczy i cenę gry, z której korzystają metoda graficzna rozwiązania do gier.
    4. Metoda iteracyjna Browna-Robinsona. Metodę iteracyjną stosuje się, gdy nie ma zastosowania metoda graficzna i gdy metoda algebraiczna i metody matrycowe. Metoda ta daje przybliżoną wartość ceny gry, a rzeczywistą wartość można uzyskać z dowolną dokładnością. Ta metoda nie jest wystarczająca do znalezienia optymalnych strategii, ale pozwala prześledzić dynamikę gry turowej i określić koszt gry dla każdego gracza na każdym kroku.
    Na przykład zadanie może brzmieć jak „wskazać optymalne strategie graczy dla gry podane przez macierz wypłat”.
    Wszystkie metody korzystają ze sprawdzania dominujących wierszy i kolumn.
  2. Gra Bimatrix. Zwykle w takiej grze określone są dwie macierze o tej samej wielkości wypłat pierwszego i drugiego gracza. Rzędy tych macierzy odpowiadają strategiom pierwszego gracza, a kolumny macierzy odpowiadają strategiom drugiego gracza. W tym przypadku pierwsza macierz przedstawia wygrane pierwszego gracza, a druga macierz przedstawia wygrane drugiego.
  3. Gry z naturą. Używane, gdy trzeba wybrać decyzja zarządu według kryteriów Maximax, Bayes, Laplace, Wald, Savage, Hurwitz.
    Dla kryterium Bayesa konieczne będzie także wprowadzenie prawdopodobieństw wystąpienia zdarzeń. Jeśli nie są określone, pozostaw wartości domyślne (będą zdarzenia równoważne).
    Dla kryterium Hurwitza wskaż poziom optymizmu λ. Jeśli ten parametr nie jest określony w warunkach, możesz użyć wartości 0, 0,5 i 1.

Wiele problemów wymaga znalezienia rozwiązań przy użyciu komputerów. Powyższe usługi i funkcje są jednym z narzędzi.



Nowość na stronie

>

Najbardziej popularny