घर रोकथाम गणितीय खेल सिद्धांत. जीवन से खेलों को रिकॉर्ड करने और हल करने के उदाहरण

गणितीय खेल सिद्धांत. जीवन से खेलों को रिकॉर्ड करने और हल करने के उदाहरण

यदि कई परस्पर विरोधी पक्ष (व्यक्ति) हैं, जिनमें से प्रत्येक नियमों के दिए गए सेट द्वारा निर्धारित एक निश्चित निर्णय लेता है, और प्रत्येक व्यक्ति प्रत्येक पक्ष के लिए पूर्व निर्धारित भुगतान के साथ संघर्ष की स्थिति की अंतिम स्थिति जानता है, तो एक खेल होने को कहा जाता है।

गेम थ्योरी का कार्य किसी दिए गए खिलाड़ी के लिए व्यवहार की एक पंक्ति चुनना है, जिससे विचलन केवल उसकी जीत को कम कर सकता है।

खेल की कुछ परिभाषाएँ

खेल के परिणामों के मात्रात्मक मूल्यांकन को भुगतान कहा जाता है।

दोगुना हो जाता है (दो व्यक्तियों) को शून्य-राशि खेल कहा जाता है यदि भुगतान का योग शून्य है, अर्थात। यदि एक खिलाड़ी की हानि दूसरे के लाभ के बराबर है।

प्रत्येक संभावित परिस्थिति में खिलाड़ी की पसंद का स्पष्ट विवरण जिसमें उसे व्यक्तिगत कदम उठाना चाहिए, कहलाता है खिलाड़ी की रणनीति .

किसी खिलाड़ी की रणनीति को इष्टतम कहा जाता है यदि, जब खेल को कई बार दोहराया जाता है, तो यह खिलाड़ी को अधिकतम संभव प्रदान करता है औसत जीत(या, जो एक ही बात है, न्यूनतम संभव औसत जीत)।

गेम को एक मैट्रिक्स द्वारा परिभाषित किया गया है होना एमलाइनें और एनस्तंभों को आयाम का एक परिमित युग्म खेल कहा जाता है एम* एन;

कहाँ मैं=
- एमरणनीति के साथ पहले खिलाड़ी की रणनीति; जे=- n रणनीतियों वाले दूसरे खिलाड़ी की रणनीति; आईजे– पहले खिलाड़ी की जीत मैं-रणनीति जब दूसरे द्वारा उपयोग की जाती है जेवें रणनीति (या, एक ही बात क्या है, इसके दूसरे का नुकसान जे-वीं रणनीति, जब पहली बार उपयोग की गई मैंवां);

ए =  आईजे- गेम का भुगतान मैट्रिक्स।

1.1 शुद्ध रणनीतियों के साथ खेलना

खेल की कम कीमत (पहले खिलाड़ी के लिए)

= अधिकतम (मिन आईजे). (1.2)

मैं जे

शीर्ष खेल मूल्य (दूसरे खिलाड़ी के लिए):

= मिन (अधिकतम आईजे) . (1.3)

जे मैं

अगर = , गेम को सैडल पॉइंट गेम (1.4), या शुद्ध रणनीतियों वाला गेम कहा जाता है। जिसमें वी = = एक मूल्यवान खेल कहा जाता है ( वी- खेल की कीमत)।

उदाहरण। 2-व्यक्ति गेम ए का भुगतान मैट्रिक्स दिया गया है। निर्धारित करें इष्टतम रणनीतियाँप्रत्येक खिलाड़ी के लिए और खेल की कीमत:

(1.4)

अधिकतम 10 9 12 6

मैं

मिन 6

जे

- पहले खिलाड़ी (पंक्ति) की रणनीति।

दूसरे खिलाड़ी की रणनीति (कॉलम)।

- खेल की कीमत.

इस प्रकार, खेल में एक काठी बिंदु है। रणनीति जे = 4 - दूसरे खिलाड़ी के लिए इष्टतम रणनीति मैं=2 - पहले के लिए. हमारे पास शुद्ध रणनीतियों वाला खेल है।

1.2 मिश्रित रणनीतियों वाले खेल

यदि भुगतान मैट्रिक्स में कोई सैडल पॉइंट नहीं है, यानी।
, और खेल में कोई भी एक योजना को अपनी इष्टतम रणनीति के रूप में नहीं चुन सकता है, खिलाड़ी "मिश्रित रणनीतियों" पर स्विच करते हैं। इसके अलावा, प्रत्येक खिलाड़ी खेल के दौरान अपनी प्रत्येक रणनीति का कई बार उपयोग करता है।

एक वेक्टर, जिसका प्रत्येक घटक खिलाड़ी द्वारा संबंधित शुद्ध रणनीति के उपयोग की सापेक्ष आवृत्ति को दर्शाता है, इस खिलाड़ी की मिश्रित रणनीति कहलाती है।

एक्स= (एक्स 1 …एक्स मैं …एक्स एम) - पहले खिलाड़ी की मिश्रित रणनीति।

यू= (पर 1 ...य जे ...य एन)- दूसरे खिलाड़ी की मिश्रित रणनीति।

एक्समैं , य जे- अपनी रणनीतियों का उपयोग करने वाले खिलाड़ियों की सापेक्ष आवृत्तियाँ (संभावनाएँ)।

मिश्रित रणनीतियों का उपयोग करने की शर्तें

. (1.5)

अगर एक्स* = (एक्स 1 * ….एक्समैं*... एक्स एम*) - पहले खिलाड़ी द्वारा चुनी गई इष्टतम रणनीति; वाई* = (पर 1 * …परजे*... पर एन*) दूसरे खिलाड़ी द्वारा चुनी गई इष्टतम रणनीति है, तो संख्या खेल की लागत है।

(1.6)

संख्या के लिए वीखेल की कीमत थी, और एक्स* और पर* - इष्टतम रणनीतियाँ, असमानताओं को संतुष्ट करने के लिए यह आवश्यक और पर्याप्त है

(1.7)

यदि कोई खिलाड़ी इष्टतम मिश्रित रणनीति का उपयोग करता है, तो उसका भुगतान खेल की लागत के बराबर होता है वीइस बात की परवाह किए बिना कि दूसरा खिलाड़ी किस आवृत्ति के साथ शुद्ध रणनीतियों सहित, इष्टतम में शामिल रणनीतियों का उपयोग करेगा।

गेम थ्योरी समस्याओं को रैखिक प्रोग्रामिंग समस्याओं में कम करना।

उदाहरण. पेऑफ मैट्रिक्स द्वारा परिभाषित गेम का समाधान ढूंढें .

ए = (1.8)

1 2 3

समाधान:

आइए रैखिक प्रोग्रामिंग समस्याओं की एक दोहरी जोड़ी बनाएं।

पहले खिलाड़ी के लिए

(1.9)

पर 1 +पर 2 +पर 3 = 1 (1.10)

अपने आप को परिवर्तनशील से मुक्त करना वी(खेल मूल्य), भावों के बाएँ और दाएँ पक्षों को (1.9), (1.10) में विभाजित करें वी. स्वीकार कर लिया है पर जे /वीएक नये वेरिएबल के लिए जेड मैं, हम पाते हैं नई प्रणालीप्रतिबंध (1.11) और लक्ष्य समारोह (1.12)

(1.11)

. (1.12)

इसी प्रकार, हमें दूसरे खिलाड़ी के लिए गेम मॉडल मिलता है:

(1.13)

एक्स 1 +एक्स 2 +एक्स 3 = 1 . (1.14)

मॉडल (1.13), (1.14) को बिना किसी चर के एक रूप में कम करना वी, हम पाते हैं

(1.15)

, (1.16)

कहाँ
.

यदि हमें पहले खिलाड़ी की व्यवहार रणनीति निर्धारित करने की आवश्यकता है, अर्थात। उसकी रणनीतियों के उपयोग की सापेक्ष आवृत्ति ( एक्स 1 ….एक्स मैं …एक्स एम), हम दूसरे प्लेयर मॉडल का उपयोग करेंगे, क्योंकि ये चर उसके भुगतान मॉडल (1.13), (1.14) में हैं।

आइए हम (1.15), (1.16) को विहित रूप में घटाएँ

(1.17)

सूचना!आपकी विशिष्ट समस्या का समाधान इस उदाहरण के समान दिखेगा, जिसमें नीचे प्रस्तुत सभी तालिकाएँ, व्याख्यात्मक पाठ और आंकड़े शामिल हैं, लेकिन आपके प्रारंभिक डेटा को ध्यान में रखते हुए...

काम:
मैट्रिक्स गेम निम्नलिखित भुगतान मैट्रिक्स द्वारा दिया गया है:

रणनीतियाँ "बी"
रणनीतियाँ "ए" बी 1बी 2
ए 1 3 5
ए 2 6
3
2

मैट्रिक्स गेम का समाधान खोजें, अर्थात्:
- खेल की शीर्ष कीमत का पता लगाएं;
- कम कीमतखेल;
- खेल का शुद्ध मूल्य;
- खिलाड़ियों की इष्टतम रणनीतियों को इंगित करें;
- लाना ग्राफिक समाधान(ज्यामितीय व्याख्या), यदि आवश्यक हो।

स्टेप 1

आइए खेल की कम कीमत निर्धारित करें - α

सबसे कम खेल कीमतα वह अधिकतम जीत है जो हम एक उचित प्रतिद्वंद्वी के खिलाफ खेल में खुद को गारंटी दे सकते हैं यदि हम पूरे खेल में एक और केवल एक रणनीति का उपयोग करते हैं (इस रणनीति को "शुद्ध" कहा जाता है)।

आइए भुगतान मैट्रिक्स की प्रत्येक पंक्ति में खोजें न्यूनतमतत्व और इसे एक अतिरिक्त कॉलम (चयनित) में लिखें पीलातालिका 1 देखें)।

फिर हम ढूंढ लेंगे अधिकतमअतिरिक्त कॉलम का तत्व (तारांकन चिह्न के साथ चिह्नित), यह गेम की कम कीमत होगी।

तालिका नंबर एक

रणनीतियाँ "बी"
रणनीतियाँ "ए" बी 1बी 2 पंक्ति मिनिमा
ए 1 3 5 3 *
ए 2 6
3
2
3
2

हमारे मामले में, खेल की कम कीमत है: α = 3, और 3 से भी बदतर जीत की गारंटी के लिए हमें रणनीति ए 1 पर कायम रहना चाहिए

चरण दो

आइए खेल की ऊपरी कीमत निर्धारित करें - β

शीर्ष गेम कीमतβ वह न्यूनतम हानि है जो खिलाड़ी बी एक उचित प्रतिद्वंद्वी के खिलाफ खेल में खुद को गारंटी दे सकता है यदि वह पूरे खेल में एक और केवल एक रणनीति का उपयोग करता है।

आइए भुगतान मैट्रिक्स के प्रत्येक कॉलम में खोजें अधिकतमतत्व और इसे नीचे एक अतिरिक्त पंक्ति में लिखें (पीले रंग में हाइलाइट किया गया, तालिका 2 देखें)।

फिर हम ढूंढ लेंगे न्यूनतमअतिरिक्त लाइन का तत्व (प्लस के साथ चिह्नित), यह गेम की ऊपरी कीमत होगी।

तालिका 2

रणनीतियाँ "बी"
रणनीतियाँ "ए" बी 1बी 2 पंक्ति मिनिमा
ए 1 3 5 3 *
ए 2 6
3
2

हमारे मामले में, खेल की ऊपरी कीमत है: β = 5, और 5 से अधिक की हानि की गारंटी के लिए, प्रतिद्वंद्वी (खिलाड़ी "बी") को रणनीति बी 2 का पालन करना होगा

चरण 3
आइए खेल की निचली और ऊपरी कीमतों की तुलना करें; इस समस्या में वे भिन्न हैं, यानी। α ≠ β, पेऑफ मैट्रिक्स में सैडल पॉइंट नहीं होता है। इसका मतलब यह है कि गेम का शुद्ध मिनिमैक्स रणनीतियों में कोई समाधान नहीं है, लेकिन मिश्रित रणनीतियों में इसका हमेशा समाधान होता है।

मिश्रित रणनीति, ये कुछ निश्चित संभावनाओं (आवृत्तियों) के साथ, बेतरतीब ढंग से बदलने वाली शुद्ध रणनीतियाँ हैं।

हम खिलाड़ी "ए" की मिश्रित रणनीति को निरूपित करेंगे

एसए=

जहां बी 1, बी 2 खिलाड़ी "बी" की रणनीतियां हैं, और क्यू 1, क्यू 2 क्रमशः संभावनाएं हैं जिनके साथ इन रणनीतियों को लागू किया जाता है, और क्यू 1 + क्यू 2 = 1।

खिलाड़ी "ए" के लिए इष्टतम मिश्रित रणनीति वह है जो उसे अधिकतम भुगतान प्रदान करती है। तदनुसार, "बी" के लिए न्यूनतम हानि है। ये रणनीतियाँ निर्दिष्ट हैं एसए* और एसबी* क्रमशः। इष्टतम रणनीतियों की एक जोड़ी खेल का समाधान बनाती है।

में सामान्य मामलाखिलाड़ी की इष्टतम रणनीति में सभी प्रारंभिक रणनीतियाँ शामिल नहीं हो सकती हैं, लेकिन उनमें से केवल कुछ ही शामिल हो सकती हैं। ऐसी रणनीतियों को कहा जाता है सक्रिय रणनीतियाँ.

चरण 4


कहाँ: पी 1 , पी 2 - संभावनाएँ (आवृत्तियाँ) जिनके साथ क्रमशः ए 1 और ए 2 रणनीतियाँ लागू की जाती हैं

खेल सिद्धांत से यह ज्ञात होता है कि यदि खिलाड़ी "ए" अपनी इष्टतम रणनीति का उपयोग करता है, और खिलाड़ी "बी" अपनी सक्रिय रणनीतियों के ढांचे के भीतर रहता है, तो औसत भुगतान अपरिवर्तित रहता है और खेल की लागत के बराबर होता है वीइस बात की परवाह किए बिना कि खिलाड़ी "बी" अपनी सक्रिय रणनीतियों का उपयोग कैसे करता है। और हमारे मामले में, दोनों रणनीतियाँ सक्रिय हैं, अन्यथा खेल का समाधान शुद्ध रणनीतियों में होता। इसलिए, यदि हम मान लें कि खिलाड़ी "बी" शुद्ध रणनीति बी 1 का उपयोग करेगा, तो औसत भुगतान वीहोगा:

के 11 पी 1 + के 21 पी 2 = वी (1)

कहाँ: ij - भुगतान मैट्रिक्स के तत्व।

दूसरी ओर, यदि हम मान लें कि खिलाड़ी "बी" शुद्ध रणनीति बी 2 का उपयोग करेगा, तो औसत भुगतान होगा:

के 12 पी 1 + के 22 पी 2 = वी (2)

समीकरण (1) और (2) के बाएँ पक्षों को बराबर करने पर हम प्राप्त करते हैं:

के 11 पी 1 + के 21 पी 2 = के 12 पी 1 + के 22 पी 2

और इस तथ्य को ध्यान में रखते हुए पी 1 + पी 2 = 1 हमारे पास है:

के 11 पी 1 + के 21 (1 - पी 1 ) = के 12 पी 1 + के 22 (1 - पी 1 )


जहां रणनीति ए 1 की इष्टतम आवृत्ति खोजना आसान है:
पी 1 =
22 - 21
11 + 22 - 12 - 21
(3)

इस कार्य में:

पी 1 =
3
2
- 6
3 +
3
2
- 5 - 6
=
9
13

संभावना आर 2 घटाव द्वारा ज्ञात करें आर 1 इकाई से:
पी 2 = 1 - पी 1 = 1 -
9
13
= + 6 ·

कहाँ: क्यू 1 , क्यू 2 - संभावनाएँ (आवृत्तियाँ) जिनके साथ क्रमशः रणनीतियाँ बी 1 और बी 2 लागू की जाती हैं

खेल सिद्धांत से यह ज्ञात होता है कि यदि खिलाड़ी "बी" अपनी इष्टतम रणनीति का उपयोग करता है, और खिलाड़ी "ए" अपनी सक्रिय रणनीतियों के ढांचे के भीतर रहता है, तो औसत भुगतान अपरिवर्तित रहता है और खेल की लागत के बराबर होता है वीइस बात की परवाह किए बिना कि खिलाड़ी A अपनी सक्रिय रणनीतियों का उपयोग कैसे करता है। इसलिए, यदि हम मान लें कि खिलाड़ी "ए" शुद्ध रणनीति ए 1 का उपयोग करेगा, तो औसत भुगतान वीहोगा:

के 11 क्यू 1 + के 12 क्यू 2 = वी (4)


खेल की कीमत के बाद से वी हम पहले से ही जानते हैं और उस पर विचार कर रहे हैं क्यू 1 + क्यू 2 = 1 , तो रणनीति बी 1 की इष्टतम आवृत्ति इस प्रकार पाई जा सकती है:
क्यू 1 =
वी - 12
11 - 12
(5)

इस कार्य में:

क्यू 1 =
51
13
- 5
3 - 5
=
7
13

संभावना क्यू 2 घटाव द्वारा ज्ञात करें क्यू 1 इकाई से:
क्यू 2 = 1 - क्यू 1 = 1 -
7
13
=
6
13

उत्तर:

खेल की न्यूनतम कीमत: α = 3
शीर्ष खेल मूल्य: β = 5
गेम की कीमत: वी =
51
13
खिलाड़ी ए की इष्टतम रणनीति:
एसए*=
ए 1ए 2
9
13
4
13

खिलाड़ी "बी" के लिए इष्टतम रणनीति:
एसबी*=
बी 1बी 2
7
13
6
13

ज्यामितीय व्याख्या (चित्रमय समाधान):

आइए हम विचाराधीन खेल की एक ज्यामितीय व्याख्या दें। इकाई लंबाई के भुज अक्ष का एक भाग लें और इसके सिरों से होकर ऊर्ध्वाधर सीधी रेखाएँ खींचें 1 और 2 हमारी रणनीतियों ए 1 और ए 2 के अनुरूप। आइए अब मान लें कि खिलाड़ी "बी" रणनीति बी 1 का उपयोग करेगा शुद्ध फ़ॉर्म. फिर, यदि हम (खिलाड़ी "ए") शुद्ध रणनीति ए 1 का उपयोग करते हैं, तो हमारा भुगतान 3 होगा। आइए अक्ष पर संबंधित बिंदु को चिह्नित करें 1 .
यदि हम शुद्ध रणनीति ए 2 का उपयोग करते हैं, तो हमारा भुगतान 6 होगा। आइए अक्ष पर संबंधित बिंदु को चिह्नित करें 2
(चित्र 1 देखें)। जाहिर है, अगर हम रणनीतियों ए 1 और ए 2 को अलग-अलग अनुपात में मिलाकर लागू करते हैं, तो हमारी जीत निर्देशांक (0, 3) और (1, 6) वाले बिंदुओं से गुजरने वाली एक सीधी रेखा के साथ बदल जाएगी, आइए इसे रणनीति बी की रेखा कहें 1 (चित्र 1 में लाल रंग में दिखाया गया है)। किसी दी गई रेखा पर किसी भी बिंदु का भुज प्रायिकता के बराबर होता है पी 2 (आवृत्ति) जिसके साथ हम रणनीति ए 2 लागू करते हैं, और कोटि - परिणामी लाभ (चित्र 1 देखें)।

चित्र 1।
अदायगी ग्राफ आवृत्ति से पी 2 , जब दुश्मन रणनीति का उपयोग करता है बी 1.

आइए अब मान लें कि खिलाड़ी "बी" अपने शुद्ध रूप में रणनीति बी 2 का उपयोग करेगा। फिर, यदि हम (खिलाड़ी "ए") शुद्ध रणनीति ए 1 का उपयोग करते हैं, तो हमारा भुगतान 5 होगा। यदि हम शुद्ध रणनीति ए 2 का उपयोग करते हैं, तो हमारा भुगतान 3/2 होगा (चित्र 2 देखें)। इसी तरह, यदि हम रणनीतियों ए 1 और ए 2 को अलग-अलग अनुपात में मिलाते हैं, तो हमारी जीत निर्देशांक (0, 5) और (1, 3/2) वाले बिंदुओं से गुजरने वाली एक सीधी रेखा के साथ बदल जाएगी, आइए इसे रणनीति की रेखा कहते हैं बी 2. पिछले मामले की तरह, इस रेखा पर किसी भी बिंदु का भुज उस संभावना के बराबर है जिसके साथ हम रणनीति ए 2 लागू करते हैं, और कोटि परिणामी लाभ है, लेकिन केवल रणनीति बी 2 के लिए (चित्र 2 देखें)।

चित्र 2।
वी और इष्टतम आवृत्ति पी 2 खिलाड़ी के लिए "ए".

एक वास्तविक खेल में, जब एक उचित खिलाड़ी "बी" अपनी सभी रणनीतियों का उपयोग करता है, तो हमारी जीत चित्र 2 में लाल रंग में दिखाई गई टूटी हुई रेखा के साथ बदल जाएगी। यह पंक्ति तथाकथित को परिभाषित करती है जीत की निचली सीमा. जाहिर है सबसे ज्यादा उच्च बिंदुयह टूटी हुई रेखा हमारी इष्टतम रणनीति से मेल खाती है। में इस मामले में, यह रणनीति बी 1 और बी 2 की रेखाओं का प्रतिच्छेदन बिंदु है। कृपया ध्यान दें कि यदि आप कोई आवृत्ति चुनते हैं पी 2 इसके भुज के बराबर, तो हमारा लाभ अपरिवर्तित और बराबर रहेगा वी खिलाड़ी "बी" की किसी भी रणनीति के लिए, यह वह अधिकतम होगी जिसकी हम स्वयं गारंटी दे सकते हैं। आवृत्ति (संभावना) पी 2 इस मामले में, हमारी इष्टतम मिश्रित रणनीति की संगत आवृत्ति है। वैसे, चित्र 2 से आप आवृत्ति देख सकते हैं पी 1 , हमारी इष्टतम मिश्रित रणनीति, खंड की लंबाई है [ पी 2 ; 1] एक्स-अक्ष पर। (ये इसलिए पी 1 + पी 2 = 1 )

पूरी तरह से समान तर्क का उपयोग करके, हम खिलाड़ी "बी" के लिए इष्टतम रणनीति की आवृत्तियों को पा सकते हैं, जिसे चित्र 3 में दिखाया गया है।

चित्र तीन।
गेम की कीमत का ग्राफ़िक निर्धारण वी और इष्टतम आवृत्ति प्रश्न 2 खिलाड़ी के लिए "में".

केवल उसके लिए तथाकथित होना चाहिए ऊपरी सीमाहार(लाल टूटी हुई रेखा) और उस पर सबसे निचले बिंदु की तलाश करें, क्योंकि खिलाड़ी "बी" के लिए लक्ष्य नुकसान को कम करना है। समान आवृत्ति मान क्यू 1 , यह खंड की लंबाई है [ क्यू 2 ; 1] एक्स-अक्ष पर।

सामग्री 1 सामान्य जानकारी 2 1.1 खेल. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 चालें। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 रणनीतियाँ। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 मैट्रिक्स गेम। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 ट्रेल प्वाइंट. शुद्ध रणनीतियाँ 7 2.1 उदाहरण। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 उदाहरण 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 उदाहरण 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 मिश्रित रणनीतियाँ 9 3.1 गेम 2×2। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1 उदाहरण। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 उदाहरण 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 उदाहरण 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.2 ज्यामितीय व्याख्या। . . . . . . . . . . . . . . . . . . . 12 3.2 गेम्स 2×एन और एम×2। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 उदाहरण 5. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1 1. खेल सिद्धांत से सामान्य जानकारी 1.1. गेम्स गेम थ्योरी संघर्ष स्थितियों का एक गणितीय सिद्धांत है, अर्थात। ऐसी स्थितियाँ जिनमें अलग-अलग लक्ष्य हासिल करने वाले दो या दो से अधिक दलों के हित टकराते हैं। एक खेल कुछ नियमों द्वारा नियंत्रित एक संघर्ष की स्थिति है, जिसमें यह दर्शाया जाना चाहिए: प्रतिभागियों के कार्यों के लिए संभावित विकल्प; खेल या भुगतान का मात्रात्मक परिणाम (जीतना, हारना) जिससे चालों का एक सेट आगे बढ़ता है; जानकारी की मात्रा प्रत्येक पक्ष का दूसरे के व्यवहार के बारे में। युगल खेल एक ऐसा खेल है जिसमें केवल दो पक्ष (दो खिलाड़ी) भाग लेते हैं। शून्य-राशि युग्मित खेल एक युग्मित खेल है जिसमें भुगतान का योग शून्य होता है, अर्थात। एक खिलाड़ी की हानि दूसरे के लाभ के बराबर होती है। भुगतान फ़ंक्शन के मूल्य के प्रति प्रत्येक खिलाड़ी के रवैये के आधार पर, युग्मित खेलों को उप-विभाजित किया जाता है: शून्य-राशि युग्मित खेल (विरोधी) - एक युग्मित खेल जिसमें भुगतान की राशि शून्य के बराबर होती है, अर्थात। एक खिलाड़ी की हानि दूसरे के लाभ के बराबर होती है। एक गैर-विरोधी खेल एक युग्मित खेल है जिसमें खिलाड़ी अलग-अलग, लेकिन सीधे विपरीत नहीं, लक्ष्यों का पीछा करते हैं। 2 1.2. चालें चाल - खेल के नियमों द्वारा प्रदान की गई क्रियाओं में से एक का चुनाव; इस विकल्प का कार्यान्वयन। चालें दो प्रकार की होती हैं: व्यक्तिगत चाल - + खेल के नियमों द्वारा प्रदान की गई क्रियाओं में से एक की सचेत पसंद + कार्यान्वयन इस पसंद की यादृच्छिक चाल - एक यादृच्छिक चाल कई संभावनाओं में से एक विकल्प है, जो खिलाड़ी के निर्णय द्वारा नहीं, बल्कि यादृच्छिक चयन के कुछ तंत्र द्वारा किया जाता है। नीचे हम शून्य-राशि युग्मित खेलों पर विचार करते हैं जिनमें केवल व्यक्तिगत चालें होती हैं। प्रत्येक पक्ष के पास दूसरे के व्यवहार के बारे में जानकारी का अभाव है। 3 1.3. रणनीतियाँ एक खिलाड़ी की रणनीति नियमों का एक समूह है जो खेल के दौरान उत्पन्न होने वाली स्थिति के आधार पर, इस खिलाड़ी की प्रत्येक व्यक्तिगत चाल के लिए कार्यों की पसंद निर्धारित करती है। संभावित रणनीतियों की संख्या के आधार पर, खेलों को सीमित और अनंत में विभाजित किया गया है। इनफिनिट गेम वह गेम है जिसमें कम से कम एक खिलाड़ी के पास होता है असीमित संख्यारणनीतियाँ। परिमित खेल वह खेल है जिसमें प्रत्येक खिलाड़ी के पास सीमित संख्या में रणनीतियाँ होती हैं। किसी भी खिलाड़ी के लिए लगातार चालों की संख्या खेल के विभाजन को एकल-चाल और बहु-चाल, या स्थितीय में निर्धारित करती है। + वन-टर्न गेम में, प्रत्येक खिलाड़ी संभावित विकल्पों में से केवल एक विकल्प चुनता है और फिर गेम का परिणाम निर्धारित करता है। + मल्टी-मूव, या पोजिशनल, गेम समय के साथ विकसित होता है, जो एक श्रृंखला का प्रतिनिधित्व करता है क्रमिक चरण, जिनमें से प्रत्येक खिलाड़ी के किसी एक कदम और स्थिति में तदनुरूप परिवर्तन के बाद घटित होता है। एक-मोड़ वाले खेल में, प्रत्येक खिलाड़ी केवल एक ही विकल्प चुनता है संभावित विकल्पऔर फिर खेल का परिणाम निर्धारित करता है। एक खिलाड़ी की इष्टतम रणनीति एक ऐसी रणनीति है, जो खेल को कई बार दोहराए जाने पर, इस खिलाड़ी को अधिकतम संभव औसत जीत (या, वही, न्यूनतम संभव औसत हानि) प्रदान करती है। गेम थ्योरी में, सभी सिफारिशें खिलाड़ियों के उचित व्यवहार की धारणा के आधार पर की जाती हैं। खिलाड़ियों की ग़लतियाँ और गलतियाँ, हर संघर्ष की स्थिति में अपरिहार्य, साथ ही उत्साह और जोखिम के तत्वों को गेम थ्योरी में ध्यान में नहीं रखा जाता है। 4 1.4. मैट्रिक्स गेम एक मैट्रिक्स गेम एक-चाल वाला परिमित शून्य-योग गेम है। मैट्रिक्स गेम एक सैद्धांतिक है गेमिंग मॉडलसंघर्ष की स्थिति जिसमें प्रतिद्वंद्वी, बिल्कुल विपरीत लक्ष्यों को प्राप्त करने के लिए, एक सीमित संख्या में से एक विकल्प (चाल) चुनते हैं संभावित तरीकेकार्रवाई। कार्रवाई के चुने हुए तरीकों (रणनीतियों) के अनुसार, प्राप्त परिणाम निर्धारित किया जाता है। आइए एक उदाहरण देखें. मान लीजिए कि दो खिलाड़ी A और B हैं, जिनमें से एक को चुना जा सकता है मैं-वें रणनीति अपनी संभावित रणनीतियों A1, A2, ...Am में से m से, और दूसरा अपनी संभावित रणनीतियों B1, B2, ...Bm में से j-th रणनीति चुनता है। परिणामस्वरूप, पहला खिलाड़ी aij मान जीतता है, और दूसरा खिलाड़ी यह मान खो देता है। संख्याओं aij से, हम एक मैट्रिक्स बनाते हैं   a11 a11 · · · a1n  a21 a22 · · · a2n    A = (aij) =  .. .. ..   । . . .  am1 am2 · · amn मैट्रिक्स A = (aij), i = 1, m, j = 1, n को पेऑफ मैट्रिक्स या m × n गेम मैट्रिक्स कहा जाता है। इस मैट्रिक्स में, पंक्तियाँ हमेशा जीतने वाले (अधिकतम करने वाले) खिलाड़ी A की रणनीतियों के लिए होती हैं, यानी वह खिलाड़ी जो अपनी जीत को अधिकतम करने का प्रयास करता है। हारने वाले खिलाड़ी बी की रणनीतियों के लिए कॉलम आवंटित किए जाते हैं, यानी वह खिलाड़ी जो दक्षता मानदंड को कम करने का प्रयास करता है। किसी गेम का सामान्यीकरण एक स्थितिगत गेम को मैट्रिक्स गेम में बदलने की प्रक्रिया है। सामान्य रूप में एक गेम एक स्थितिगत गेम है जिसे मैट्रिक्स गेम में बदल दिया जाता है। आइए याद रखें कि एक स्थितिगत मल्टी-मूव गेम एक गेम-सैद्धांतिक मॉडल है संघर्ष की स्थिति जिसमें प्रतिद्वंद्वी इस स्थिति के विकास के प्रत्येक चरण में कार्रवाई के संभावित तरीकों की एक सीमित संख्या में से क्रमिक रूप से एक विकल्प (चाल) करते हैं। खेल का समाधान दोनों खिलाड़ियों की इष्टतम रणनीतियों का पता लगाना और खेल की कीमत निर्धारित करना है। खेल की कीमत खिलाड़ियों का अपेक्षित लाभ (हानि) है। खेल का समाधान या तो शुद्ध रणनीतियों में पाया जा सकता है - जब खिलाड़ी को एक ही रणनीति का पालन करना होगा, या मिश्रित में, जब खिलाड़ी को कुछ संभावनाओं के साथ दो या अधिक शुद्ध रणनीतियों का उपयोग करना होगा। इस मामले में उत्तरार्द्ध को सक्रिय कहा जाता है। 5 एक खिलाड़ी की मिश्रित रणनीति एक वेक्टर है, जिसका प्रत्येक घटक खिलाड़ी द्वारा संबंधित शुद्ध रणनीति के उपयोग की आवृत्ति को दर्शाता है। खेल की अधिकतम या कम कीमत - संख्या α = अधिकतम न्यूनतम aij i j अधिकतम रणनीति (लाइन) - वह रणनीति जिसे खिलाड़ी ने अपनी न्यूनतम जीत को अधिकतम करने के लिए चुना है। जाहिर है, सबसे सतर्क मैक्सिमम रणनीति चुनते समय, खिलाड़ी ए खुद को (प्रतिद्वंद्वी के व्यवहार की परवाह किए बिना) कम से कम α की गारंटीकृत अदायगी प्रदान करता है। खेल की अधिकतम या ऊपरी कीमत - संख्या β = न्यूनतम अधिकतम aij j i मिनिमैक्स रणनीति (कॉलम) - वह रणनीति जिसे खिलाड़ी ने अपने अधिकतम नुकसान को कम करने के लिए चुना है। जाहिर है, सबसे सतर्क मिनिमैक्स रणनीति चुनते समय, खिलाड़ी बी, किसी भी परिस्थिति में, खिलाड़ी ए को β से अधिक जीतने की अनुमति नहीं देता है। गेम की निचली कीमत हमेशा गेम की ऊपरी कीमत से अधिक नहीं होती है α = अधिकतम न्यूनतम aij 6 मिनट अधिकतम aij = β i j j i प्रमेय 1 (मैट्रिक्स गेम के सिद्धांत का मुख्य प्रमेय)। प्रत्येक परिमित खेल में कम से कम एक समाधान होता है, संभवतः मिश्रित रणनीतियों के दायरे में। 6 2. सैडल पॉइंट वाले खेल। शुद्ध रणनीतियों में समाधान सैडल पॉइंट वाला गेम एक ऐसा गेम है जिसके लिए α = अधिकतम न्यूनतम aij = न्यूनतम अधिकतम aij = β i j j i सैडल पॉइंट वाले गेम के लिए, समाधान ढूंढने में मैक्सिमम और मिनिमैक्स रणनीतियों को चुनना शामिल है जो इष्टतम हैं। खेल की शुद्ध लागत - सामान्य अर्थखेल की निचली और ऊपरी कीमतें α=β=ν 2.1. उदाहरण उदाहरण 1 मैट्रिक्स द्वारा दी गई खेल की शुद्ध रणनीतियों में समाधान खोजें   8 4 7 ए= 6 5 9  7 7 8 समाधान: खेल की ऊपरी और निचली कीमत निर्धारित करें। ऐसा करने के लिए, हम aij की न्यूनतम संख्या ज्ञात करते हैं मैं-वीं पंक्ति αi = न्यूनतम aij j और jth कॉलम में अधिकतम संख्या aij βj = अधिकतम aij i हम एक अतिरिक्त कॉलम के रूप में दाईं ओर भुगतान मैट्रिक्स के आगे संख्या αi (पंक्ति न्यूनतम) लिखेंगे। हम मैट्रिक्स के नीचे संख्याओं βi (कॉलम मैक्सिमा) को एक अतिरिक्त रेखा के रूप में लिखते हैं: αi 8 4 7 4 6 5 9 5 7 7 8 7 βj 8 7 9 7 संख्याओं की अधिकतम संख्या ज्ञात करें αi α = अधिकतम αi = 7 i और संख्याओं का न्यूनतम βj β = न्यूनतम βj = 7 j α = β - खेल में एक सैडल पॉइंट होता है। खिलाड़ी के लिए इष्टतम रणनीति रणनीति A3 है, और खिलाड़ी B के लिए रणनीति B2 है, शुद्ध खेल मूल्य ν = 7 उदाहरण 2 भुगतान मैट्रिक्स दिया गया है:   2 2 1 1 2  0 1 1 1 1  A=  1 1 1 1 2   1 2 1 1 2 शुद्ध रणनीतियों में खेल का समाधान खोजें। समाधान: 2 2 1 1 2 1 0 1 1 1 1 0 1 1 1 1 1 2 1 1 2 1 1 2 1 βj 2 2 1 1 2 α = β = 1. गेम में छह सैडल पॉइंट हैं। इष्टतम रणनीतियाँ होंगी: A1 और B3 या B4 A3 और B3 या B4 A4 और B3 या B4 8 3. मिश्रित रणनीतियों में खेल का समाधान जब α = β। ऐसे मामले में जब, अपनी रणनीति चुनते समय, दोनों खिलाड़ियों को दूसरे की पसंद के बारे में कोई जानकारी नहीं होती है, खेल में मिश्रित रणनीतियों में समाधान होता है। SA = (p1, p2, ..., pm) - खिलाड़ी A की मिश्रित रणनीति, जिसमें रणनीतियों A1, A2, ..., Am को संभावनाओं के साथ लागू किया जाता है ∑ m p1, p2, ..., pm, pi = 1, pi > 0, i = 1, m i=1 SB = (q1, q2, ..., qn) - खिलाड़ी B की मिश्रित रणनीति, जिसमें रणनीतियों B1, B2, ..., Bm को संभावनाओं के साथ लागू किया जाता है ∑ n q1, q2 , ..., qm , qi = 1, qi > 0, i = 1, n i=1 यदि: SA∗ खिलाड़ी A की इष्टतम रणनीति है, SB∗ खिलाड़ी B की इष्टतम रणनीति है, तो खेल की लागत है ∑ n ∑ m ν = aij · p∗i · qi∗ j=1 i=1 निम्नलिखित प्रमेय इस प्रश्न का उत्तर देता है कि खेल 2 × 2, 2 × n, m × का समाधान कैसे खोजा जाए 2 प्रमेय 2 (खेल 2 × 2, 2 × एन, एम × 2 के लिए समाधान कैसे खोजें)। यदि खिलाड़ियों में से कोई एक इष्टतम मिश्रित रणनीति का उपयोग करता है, तो उसका भुगतान खेल की लागत ν के बराबर होता है, इस संभावना की परवाह किए बिना कि दूसरा खिलाड़ी इष्टतम रणनीति (शुद्ध रणनीतियों सहित) में शामिल रणनीतियों का उपयोग करेगा। 9 3.1. गेम 2 × 2 मैट्रिक्स के साथ 2 × 2 गेम पर विचार करें: () ए11 ए21 ए21 ए22 मान लें कि गेम का शुद्ध रणनीतियों में कोई समाधान नहीं है। आइए इष्टतम रणनीतियाँ SA∗ और SB∗ ढूंढें। सबसे पहले, हम रणनीति SA∗ = (p∗1 , p∗2) को परिभाषित करते हैं। प्रमेय के अनुसार, यदि पार्टी ए रणनीति ν का पालन करती है, तो पार्टी बी की कार्रवाई की परवाह किए बिना, भुगतान ν खेलने की लागत के बराबर रहेगा। नतीजतन, यदि पक्ष A इष्टतम रणनीति SA∗ = (p∗1 , p∗2) का पालन करता है, तो पक्ष B अपने भुगतान को बदले बिना अपनी किसी भी रणनीति को लागू कर सकता है। फिर, जब खिलाड़ी B शुद्ध रणनीति B1 या B2 का उपयोग करता है, तो खिलाड़ी को खेल की लागत के बराबर औसत भुगतान प्राप्त होगा: रणनीति B1 a12 p∗1 + a22 p∗ के लिए a11 p∗1 + a21 p∗2 = ν ← 2 = ν ← रणनीति बी2 के लिए ध्यान दें कि p∗1 + p∗2 = 1: p∗1 = a2 2−a2 1 a11 +a22 −a12 −a21 p∗2 = a1 1−a1 2 a11 +a22 −a12 −a21 गेम की कीमत: a22 a11 − a12 a21 ν= a11 + a22 − a12 − a21 खिलाड़ी B की इष्टतम रणनीति इसी प्रकार पाई जाती है: SB∗ = (q1∗ , q2∗)। इस बात को ध्यान में रखते हुए कि q1∗ + q2∗ = 1: q1∗ = a2 2−a1 2 a11 +a22 −a12 −a21 q2∗ = a1 1−a2 1 a11 +a22 −a12 −a21 3.1.1. उदाहरण उदाहरण 3 मैट्रिक्स के साथ खेल का समाधान खोजें () −1 1 ए= 1 −1 10 समाधान: खेल में कोई सैडल पॉइंट नहीं है, क्योंकि α= -1, β = 1, α ̸= β। हम मिश्रित रणनीतियों में समाधान तलाश रहे हैं। p∗ और q∗ के सूत्रों का उपयोग करके, हम p∗1 = p∗2 = 0.5 और q1∗ = q2∗ = 0.5, ν = 0 प्राप्त करते हैं। इस प्रकार, SA∗ = (0.5, 0.5) SB∗ = (0.5, 0.5) ) उदाहरण 4 मैट्रिक्स के साथ गेम का समाधान ढूंढें () 2 5 ए = 6 4 समाधान: गेम में कोई सैडल पॉइंट नहीं है, क्योंकि α = 4, β = 5, α ̸ = β। हम मिश्रित रणनीतियों में समाधान तलाश रहे हैं। p∗ और q∗ के सूत्रों का उपयोग करके, हम p∗1 = 0.4, p∗2 = 0.6 और q1∗ = 0.2 q2∗ = 0.8, ν = 4.4 प्राप्त करते हैं। इस प्रकार, SA∗ = (0.4, 0.6) SB∗ = ( 0.2, 0.8) 11 3.1.2. ज्यामितीय व्याख्या गेम 2 × 2 को एक सरल ज्यामितीय व्याख्या दी जा सकती है। आइए हम भुज अक्ष का एक खंड लें, जिसके प्रत्येक बिंदु को हम किसी मिश्रित रणनीति S = (p1, p2) = (p1, 1 − p1) से जोड़ते हैं और रणनीति A1 की संभावना p1 इससे दूरी के बराबर होगी अनुभाग के दाएँ छोर पर बिंदु SA, और प्रायिकता p2, रणनीति A2 - बाएँ छोर की दूरी। .y .I .I I .B1′ .N .B1 .a21 .a11 .I I .I .∗ .x .P2 .SA∗ .P1∗ विशेष रूप से, अनुभाग का बायां छोर (भुजा = 0 वाला बिंदु) मेल खाता है रणनीति A1 के लिए, खंड का दाहिना छोर (x = 1) - रणनीति A2 खंड के अंत में, x-अक्ष पर दो लंबवत बहाल किए जाते हैं: अक्ष I - I - रणनीति A1 के लिए भुगतान स्थगित कर दिया गया है; अक्ष II - II - रणनीति A2 के लिए भुगतान स्थगित कर दिया गया है। खिलाड़ी B को रणनीति B1 लागू करने दें; यह अक्षों I - I और II - II पर क्रमशः a11 और a21 कोटि वाले बिंदु देता है। हम इन बिंदुओं से होकर एक सीधी रेखा B1 - B1' खींचते हैं। किसी भी मिश्रित रणनीति SA = (p1, p2) के लिए, खिलाड़ी का भुगतान सीधी रेखा B1 - B1' पर बिंदु N द्वारा निर्धारित किया जाता है, जो खंड को p2: p1 के अनुपात में विभाजित करने वाले x-अक्ष पर बिंदु SA के अनुरूप होता है। जाहिर है, सीधी रेखा B2 − B2′, जो रणनीति B2 के लिए भुगतान निर्धारित करती है, बिल्कुल उसी तरह से बनाई जा सकती है। 12 .y .I .I I .B2 .N .a21 .B2′ a . 22 .I I .I .∗ .x .P2 .SA∗ .P1∗ इष्टतम रणनीति SA∗ खोजना आवश्यक है, अर्थात। जैसे कि खिलाड़ी ए का न्यूनतम भुगतान (खिलाड़ी बी द्वारा उसके लिए सबसे खराब व्यवहार दिया गया) अधिकतम में बदल जाएगा। ऐसा करने के लिए, रणनीतियों बी1, बी2, यानी के लिए खिलाड़ी ए के भुगतान के लिए निचली सीमा का निर्माण करें। टूटी हुई रेखा B1 N B2′ ;. इस सीमा पर खिलाड़ी ए की किसी भी मिश्रित रणनीति के लिए न्यूनतम भुगतान, बिंदु एन, स्थित होगा, जिस पर यह भुगतान अधिकतम तक पहुंचता है और खेल का निर्णय और कीमत निर्धारित करता है। .y .I .I I .B2 .B1′ .N .B1 .B2′ .I I .I .∗ .x .P2 . ए∗ एस . 1∗ P बिंदु N की कोटि खेल ν की लागत से अधिक कुछ नहीं है, इसका भुज ∗2 के बराबर है, और खंड के दाहिने छोर की दूरी ∗1 के बराबर है, अर्थात। बिंदु SA∗ से खंड के अंत तक की दूरी खिलाड़ी A की इष्टतम मिश्रित रणनीति की रणनीतियों A2 और A1 की संभावनाओं ∗2 और ∗1 के बराबर है। इस मामले में, खेल का समाधान चौराहे द्वारा निर्धारित किया गया था रणनीतियों का बिंदु B1 और B2. नीचे एक ऐसा मामला है जहां खिलाड़ी की इष्टतम रणनीति शुद्ध रणनीति A2 है। यहां रणनीति A2 (किसी भी शत्रु रणनीति के लिए) रणनीति A1, 13 .y .y .I .I I .I I. I .B2′ से अधिक लाभदायक है। 1′ बी .बी1′ बी . 2 .बी2′ बी . 2 .B1 .ν = a21 .B1 .ν = a21 I. I I. I .I . .x .मैं . ।एक्स। 2∗ पी . A∗S = A2. 2∗ पी . A∗ S = A2 दाईं ओर उस मामले को दिखाया गया है जब खिलाड़ी B के पास स्पष्ट रूप से लाभहीन रणनीति है। ज्यामितीय व्याख्या से खेल α की कम कीमत और ऊपरी कीमत β .y .I .I I .B2 की कल्पना करना भी संभव हो जाता है। .B1′ .N .B1 . B2′ .β = a21 .α = a22 .I I .I .∗ .x .P2 . ए∗ एस . 1∗ P उसी ग्राफ़ पर, हम खिलाड़ी B की इष्टतम रणनीतियों की ज्यामितीय व्याख्या भी दे सकते हैं। यह सत्यापित करना आसान है कि इष्टतम मिश्रित रणनीति SB∗ = (q1∗ , q2∗) की रणनीति B1 का हिस्सा q1∗ खंड KB2 की लंबाई और खंड KB1 की लंबाई के योग के अनुपात के बराबर है। और I - I अक्ष पर KB2: .y .I .I I .B2 . B1′ .N .K .L .B1 .B2′ .I I .I .∗ .x .P2 . ए∗ एस . 1∗ P 14 KB2 q1∗ = KB2 + KB1 या LB2′ q1∗ = LB2′ + LB1′ इष्टतम रणनीति SB∗ = (q1∗ , q2∗) दूसरे तरीके से पाई जा सकती है, यदि हम खिलाड़ियों B और B की अदला-बदली करते हैं, और जीत की निचली सीमा के अधिकतम के बजाय, ऊपरी सीमा के न्यूनतम पर विचार करें। .य .मैं .मैं मैं .ए2 .ए′1 .एन .ए1 .ए′2 .मैं मैं .मैं . .x .q2∗ . B∗ S .q1∗ 15 3.2. 2 × n और m × 2 गेम 2 × n और m × 2 गेम का समाधान निम्नलिखित प्रमेय पर आधारित है। प्रमेय 3. किसी भी परिमित खेल m × n का एक समाधान होता है जिसमें प्रत्येक पक्ष की सक्रिय रणनीतियों की संख्या m और n की सबसे छोटी संख्या से अधिक नहीं होती है। इस प्रमेय के अनुसार, 2 × n गेम में हमेशा एक समाधान होता है जिसमें प्रत्येक खिलाड़ी के पास अधिकतम दो सक्रिय रणनीतियाँ होती हैं। एक बार जब आपको ये रणनीतियाँ मिल जाती हैं, तो 2×n गेम 2×2 गेम में बदल जाता है, जिसे प्राथमिक तरीके से हल किया जा सकता है। सक्रिय रणनीतियों को ढूँढना ग्राफ़िक रूप से किया जा सकता है: 1) एक ग्राफ़िकल व्याख्या का निर्माण किया जाता है; 2) जीत की निचली सीमा निर्धारित की जाती है; 3) दूसरे खिलाड़ी की दो रणनीतियों को भुगतान की निचली सीमा पर पहचाना जाता है, जो अधिकतम कोटि वाले बिंदु पर प्रतिच्छेद करने वाली दो रेखाओं के अनुरूप होती हैं (यदि इस बिंदु पर दो से अधिक रेखाएं प्रतिच्छेद करती हैं, तो कोई भी जोड़ी ली जाती है) - ये रणनीतियाँ खिलाड़ी बी की सक्रिय रणनीतियों का प्रतिनिधित्व करते हैं। इस प्रकार, गेम 2 × एन को गेम 2 × 2 में घटा दिया जाता है। गेम एम × 2 को भी हल किया जा सकता है, इस अंतर के साथ कि निचला नहीं, बल्कि भुगतान की ऊपरी सीमा है निर्मित, और उस पर अधिकतम नहीं, बल्कि न्यूनतम मांगा जाता है। उदाहरण 5 खेल का समाधान खोजें () 7 9 8 ए= 10 6 9 समाधान: ज्यामितीय विधि का उपयोग करके, हम सक्रिय रणनीतियों का चयन करते हैं। सीधी रेखाएँ B1 - B1', B2 - B2' और B3 - B3' रणनीतियाँ B1, B2, B3 के अनुरूप हैं। टूटी हुई रेखा B1 N B2 खिलाड़ी की जीत की निचली सीमा है। गेम का एक समाधान है S∗A = (23, 31); एस∗बी = (0.5; 0.5; 0); v = 8. 16 .y .I .I I . 1′ बी बी . 2 .B3′ .N .B3 .B1 .B2′ .I I .I . ।एक्स। 2∗ पी . ए∗ एस . 1∗ पी 17 इंडेक्स गेम, 2 चाल, 3 2 × 2, 10 व्यक्तिगत, 3 2 × 2, 9 यादृच्छिक, 3 ज्यामिति, 12 नेट गेम मूल्य, 7 उदाहरण, 10 2 × एन, 9, 16 मीटर × 2, 9 , 16 अनंत, 4 सामान्य रूप में, 5 परिमित, 4 बहु-चाल, 4 एक-चाल, 4 मैट्रिक्स, 5 युग्मित, 2 शून्य-योग, 2 विरोधी, 2 गैर-विरोधी, 2 समाधान, 5 मिश्रित रणनीतियों में, 5 , शुद्ध रणनीतियों में 9, सैडल प्वाइंट के साथ 5, 7 मूल्य, 5 ऊपरी, 6 निचला, 6 शुद्ध, 7 मैक्सिमम, 6 गेम मैट्रिक्स, 5 पेऑफ, 5 मिनिमैक्स, 6 गेम सामान्यीकरण, 5 रणनीति, 4 मैक्सिमम, 6 मिनिमैक्स, 6 इष्टतम, 4 मिश्रित, 5 खेल सिद्धांत, 2 18

लोकप्रिय अमेरिकी ब्लॉग क्रैक्ड से।

गेम थ्योरी सबसे अच्छा कदम उठाने के तरीकों का अध्ययन करने के बारे में है और परिणामस्वरूप, अन्य खिलाड़ियों से कुछ काटकर जितना संभव हो उतना जीतने वाली पाई प्राप्त करें। यह आपको कई कारकों का विश्लेषण करना और तार्किक रूप से संतुलित निष्कर्ष निकालना सिखाता है। मेरा मानना ​​है कि इसका अध्ययन अंकों के बाद और वर्णमाला से पहले किया जाना चाहिए। सिर्फ इसलिए कि बहुत से लोग अंतर्ज्ञान, गुप्त भविष्यवाणियों, सितारों के स्थान और इसी तरह के आधार पर महत्वपूर्ण निर्णय लेते हैं। मैंने गेम थ्योरी का गहन अध्ययन किया है, और अब मैं आपको इसकी मूल बातों के बारे में बताना चाहता हूं। शायद यह आपके जीवन में कुछ सामान्य ज्ञान जोड़ देगा।

1. कैदी की दुविधा

भागने के लिए चोरी की कार का उचित उपयोग करने में विफल रहने के बाद बर्टो और रॉबर्ट को बैंक डकैती के आरोप में गिरफ्तार किया गया था। पुलिस यह साबित नहीं कर सकती कि उन्होंने ही बैंक लूटा था, लेकिन उन्होंने उन्हें चोरी की कार में रंगे हाथ पकड़ लिया था। उन्हें अलग-अलग कमरों में ले जाया गया और प्रत्येक को एक सौदे की पेशकश की गई: एक साथी को सौंपने और उसे 10 साल के लिए जेल भेजने और खुद रिहा होने का। परन्तु यदि वे दोनों एक दूसरे के साथ विश्वासघात करें, तो प्रत्येक को सात वर्ष की सज़ा मिलेगी। अगर किसी ने कुछ नहीं कहा तो दोनों को सिर्फ कार चोरी के आरोप में 2 साल के लिए जेल जाना पड़ेगा।

इससे पता चलता है कि यदि बर्टो चुप रहता है, लेकिन रॉबर्ट उसे अंदर कर देता है, तो बर्टो 10 साल के लिए जेल चला जाता है, और रॉबर्ट मुक्त हो जाता है।

प्रत्येक कैदी एक खिलाड़ी है, और प्रत्येक के लाभ को एक "सूत्र" के रूप में व्यक्त किया जा सकता है (उन दोनों को क्या मिलेगा, दूसरे को क्या मिलेगा)। उदाहरण के लिए, यदि मैं तुम्हें मारता हूं, तो मेरी जीत का पैटर्न इस तरह दिखेगा (मुझे बुरी जीत मिलती है, तुम्हें भुगतना पड़ता है गंभीर दर्द). चूँकि प्रत्येक कैदी के पास दो विकल्प होते हैं, हम परिणामों को एक तालिका में प्रस्तुत कर सकते हैं।

व्यावहारिक अनुप्रयोग: समाजोपथों की पहचान करना

यहां हम गेम थ्योरी का मुख्य अनुप्रयोग देखते हैं: उन समाजोपथों की पहचान करना जो केवल अपने बारे में सोचते हैं।सच्चा गेम सिद्धांत एक शक्तिशाली विश्लेषणात्मक उपकरण है, और शौकियापन अक्सर एक लाल झंडे के रूप में कार्य करता है जो किसी ऐसे व्यक्ति को चिह्नित करता है जिसके पास सम्मान की कोई भावना नहीं है। जो लोग सहज गणना करते हैं उनका मानना ​​है कि कुछ बदसूरत करना बेहतर है क्योंकि इससे जेल की सजा कम होगी चाहे दूसरा खिलाड़ी कुछ भी करे। तकनीकी रूप से यह सही है, लेकिन केवल तभी जब आप अदूरदर्शी व्यक्ति हों और संख्याएँ अधिक बता रहे हों मानव जीवन. यही कारण है कि गेम थ्योरी वित्त में इतनी लोकप्रिय है।

कैदी की दुविधा के साथ असली समस्या यह है कि वह डेटा को नजरअंदाज कर देता है।उदाहरण के लिए, यह उस व्यक्ति के दोस्तों, रिश्तेदारों या यहां तक ​​कि लेनदारों से आपकी मुलाकात की संभावना पर विचार नहीं करता है, जिसे आपने 10 साल के लिए जेल भेजा है।

सबसे बुरी बात यह है कि कैदी की दुविधा में शामिल हर कोई ऐसा व्यवहार करता है मानो उसने इसके बारे में कभी सुना ही न हो।

और सबसे अच्छा कदम है चुप रहना और दो साल बाद किसी अच्छे दोस्त के साथ मिलकर उसी पैसे का इस्तेमाल करना।

2. प्रमुख रणनीति

यह एक ऐसी स्थिति है जिसमें आपके कर्म देते हैं सबसे बड़ी जीत, प्रतिद्वंद्वी के कार्यों की परवाह किए बिना।चाहे कुछ भी हो, आपने सब कुछ ठीक किया। यही कारण है कि कैदी की दुविधा वाले कई लोग मानते हैं कि विश्वासघात से "सर्वोत्तम" परिणाम मिलता है, चाहे दूसरा व्यक्ति कुछ भी करे, और इस पद्धति में निहित वास्तविकता की अज्ञानता इसे बहुत आसान बनाती है।

हमारे द्वारा खेले जाने वाले अधिकांश खेलों में सख्ती से प्रभावी रणनीतियाँ नहीं होती हैं क्योंकि अन्यथा वे भयानक होंगे। सोचिए अगर आप हमेशा एक ही काम करते। रॉक-पेपर-कैंची के खेल में कोई प्रभावी रणनीति नहीं है। लेकिन यदि आप किसी ऐसे व्यक्ति के साथ खेल रहे थे जिसके पास ओवन मिट्स थे और वह केवल पत्थर या कागज दिखा सकता था, तो आपके पास एक प्रमुख रणनीति होगी: कागज। आपका पेपर उसके पत्थर को लपेट देगा या परिणाम ड्रॉ में होगा, और आप हार नहीं सकते क्योंकि आपका प्रतिद्वंद्वी कैंची नहीं दिखा सकता है। अब जब आपके पास एक प्रभावी रणनीति है, तो आप कुछ अलग करने की कोशिश करने में मूर्ख होंगे।

3. लिंगों की लड़ाई

खेल तब अधिक दिलचस्प होते हैं जब उनमें सख्ती से प्रभावी रणनीति न हो। उदाहरण के लिए, लिंगों की लड़ाई. अंजलि और बोरिस्लाव डेट पर जाते हैं, लेकिन बैले और बॉक्सिंग के बीच चयन नहीं कर पाते। अंजलि को मुक्केबाजी पसंद है क्योंकि उसे दर्शकों की चीखती भीड़ की खुशी के लिए खून बहते हुए देखना अच्छा लगता है, जो सोचते हैं कि वे सिर्फ इसलिए सभ्य हैं क्योंकि उन्होंने किसी का सिर फोड़ने के लिए भुगतान किया है।

बोरिसलाव बैले देखना चाहता है क्योंकि वह समझता है कि बैलेरिना किस दौर से गुजरती हैं बड़ी राशिचोटें और सबसे कठिन प्रशिक्षण, यह जानते हुए कि एक चोट सब कुछ खत्म कर सकती है। बैले नर्तक - महानतम एथलीटजमीन पर। एक बैलेरीना आपके सिर पर लात मार सकती है, लेकिन वह ऐसा कभी नहीं करेगी, क्योंकि उसके पैर की कीमत आपके चेहरे से कहीं अधिक है।

उनमें से प्रत्येक अपने पसंदीदा कार्यक्रम में जाना चाहता है, लेकिन वे अकेले इसका आनंद नहीं लेना चाहते हैं, इसलिए यहां बताया गया है कि वे कैसे जीतते हैं: उच्चतम मूल्य- वही करें जो उन्हें पसंद हो, सबसे छोटा मूल्य- बस किसी अन्य व्यक्ति के साथ रहना, और शून्य - अकेले रहना।

कुछ लोग जिद्दी स्वभाव का सुझाव देते हैं: यदि आप वही करते हैं जो आप चाहते हैं, चाहे कुछ भी हो, दूसरे व्यक्ति को आपकी पसंद के अनुरूप होना होगा या सब कुछ खोना होगा। जैसा कि मैंने पहले ही कहा, सरलीकृत खेल सिद्धांत मूर्खों की पहचान करने में बहुत अच्छा है।

व्यावहारिक अनुप्रयोग: तेज़ कोनों से बचें

बेशक, इस रणनीति की अपनी महत्वपूर्ण कमियां भी हैं। सबसे पहले, यदि आप अपनी डेटिंग को "लिंगों की लड़ाई" के रूप में मानते हैं, तो यह काम नहीं करेगा। ब्रेकअप करें ताकि आप में से प्रत्येक को कोई ऐसा व्यक्ति मिल सके जिसे वे पसंद करते हों। और दूसरी समस्या यह है कि इस स्थिति में प्रतिभागी स्वयं को लेकर इतने अनिश्चित होते हैं कि वे ऐसा नहीं कर पाते हैं।

हर किसी के लिए वास्तव में जीतने की रणनीति वही करना है जो वे चाहते हैं।और उसके बाद, या अगले दिन, जब वे खाली हों, एक साथ किसी कैफे में जाएँ। या बॉक्सिंग और बैले के बीच तब तक बदलाव करें जब तक कि मनोरंजन जगत में क्रांति न आ जाए और बॉक्सिंग बैले का आविष्कार न हो जाए।

4. नैश संतुलन

नैश संतुलन चालों का एक सेट है जहां तथ्य के बाद कोई भी कुछ अलग नहीं करना चाहता है।और यदि हम इसे कार्यान्वित कर सकते हैं, तो गेम थ्योरी ग्रह पर संपूर्ण दार्शनिक, धार्मिक और वित्तीय प्रणाली को प्रतिस्थापित कर देगी, क्योंकि "टूट न जाने की इच्छा" मानवता के लिए और अधिक शक्तिशाली हो गई है प्रेरक शक्तिआग से भी ज्यादा.

आइए जल्दी से $100 बाँट लें। आप और मैं निर्णय लेते हैं कि हमें सैकड़ों में से कितने की आवश्यकता है और साथ ही हम कितनी राशि की घोषणा करते हैं। यदि हमारा कुल राशिसौ से भी कम, हर किसी को वह मिलता है जो वे चाहते थे। अगर कुलसौ से अधिक, जिसने सबसे कम राशि मांगी उसे वांछित राशि मिलती है, और लालची व्यक्ति को जो बचता है उसे मिलता है। यदि हम समान राशि मांगते हैं, तो प्रत्येक को $50 मिलते हैं। आप कितना पूछेंगे? आप पैसे का बंटवारा कैसे करेंगे? केवल एक ही विजयी चाल है।

$51 का दावा करने पर आपको मिलेगा अधिकतम राशिइससे कोई फर्क नहीं पड़ता कि आपका प्रतिद्वंद्वी क्या चुनता है। यदि वह और अधिक मांगता है, तो आपको $51 प्राप्त होंगे। यदि वह $50 या $51 मांगता है, तो आपको $50 प्राप्त होंगे। और यदि वह $50 से कम मांगता है, तो आपको $51 प्राप्त होंगे। किसी भी तरह से, ऐसा कोई अन्य विकल्प नहीं है जो आपको इससे अधिक पैसा दिला सके। नैश संतुलन - एक ऐसी स्थिति जिसमें हम दोनों $51 चुनते हैं।

व्यावहारिक अनुप्रयोग: पहले सोचें

यह गेम थ्योरी का संपूर्ण बिंदु है। आपको जीतना नहीं है, अन्य खिलाड़ियों को नुकसान तो बिल्कुल नहीं पहुंचाना है, लेकिन आपको अपने लिए सर्वश्रेष्ठ कदम उठाना है, भले ही आपके आस-पास के लोग आपके लिए क्या सोच रहे हों। और यह और भी अच्छा है अगर यह कदम अन्य खिलाड़ियों के लिए फायदेमंद हो। यह उस प्रकार का गणित है जो समाज को बदल सकता है।

इस विचार का एक दिलचस्प बदलाव शराब पीना है, जिसे समय पर निर्भर नैश संतुलन कहा जा सकता है। जब आप पर्याप्त मात्रा में शराब पीते हैं, तो आप दूसरे लोगों के कार्यों की परवाह नहीं करते, चाहे वे कुछ भी करें, लेकिन अगले दिन आपको वास्तव में कुछ अलग न कर पाने का पछतावा होता है।

5. टॉस खेल

टॉस खिलाड़ी 1 और खिलाड़ी 2 के बीच खेला जाता है। प्रत्येक खिलाड़ी एक साथ हेड या टेल चुनता है। यदि वे सही अनुमान लगाते हैं, तो खिलाड़ी 1 को खिलाड़ी 2 का सिक्का मिलता है। यदि नहीं, तो खिलाड़ी 2 को खिलाड़ी 1 का सिक्का मिलता है।

विजेता मैट्रिक्स सरल है...

...इष्टतम रणनीति: पूरी तरह से यादृच्छिक रूप से खेलें।यह आपके विचार से अधिक कठिन है क्योंकि चयन पूरी तरह से यादृच्छिक होना चाहिए। यदि आपके पास चित या पट की प्राथमिकता है, तो आपका प्रतिद्वंद्वी इसका उपयोग आपके पैसे लेने के लिए कर सकता है।

निःसंदेह, यहां वास्तविक समस्या यह है कि यह बहुत बेहतर होगा यदि वे एक-दूसरे पर एक पैसा भी फेंकें। परिणामस्वरूप, उनका मुनाफा समान होगा, और परिणामी आघात इन दुर्भाग्यपूर्ण लोगों को भयानक बोरियत के अलावा कुछ और महसूस करने में मदद कर सकता है। आख़िर ये सबसे ख़राब खेलसदैव विद्यमान. और यह पेनल्टी शूटआउट के लिए आदर्श मॉडल है।

व्यावहारिक अनुप्रयोग: जुर्माना

फ़ुटबॉल, हॉकी और कई अन्य खेलों में, अतिरिक्त समय पेनल्टी शूटआउट है। और वे अधिक दिलचस्प होंगे यदि वे खिलाड़ियों की संख्या पर आधारित हों पूर्ण प्रपत्रकार्टव्हील करने में सक्षम होंगे क्योंकि यह कम से कम उनकी शारीरिक क्षमता का संकेत होगा और देखने में मजेदार होगा। गोलकीपर किसी गेंद या पक की गति को उसके आरंभ में ही स्पष्ट रूप से निर्धारित नहीं कर सकते, क्योंकि, दुर्भाग्य से, रोबोट अभी भी हमारी खेल प्रतियोगिताओं में भाग नहीं लेते हैं। गोलकीपर को बाएँ या दाएँ दिशा का चयन करना चाहिए और आशा करनी चाहिए कि उसकी पसंद प्रतिद्वंद्वी की पसंद से मेल खाती है जो गोल पर शूटिंग कर रहा है। इसमें सिक्कों के खेल के साथ कुछ समानता है।

हालाँकि, ध्यान दें कि यह हेड और टेल के खेल की समानता का एक आदर्श उदाहरण नहीं है, क्योंकि भले ही सही चुनाव करनादिशा, गोलकीपर गेंद को नहीं पकड़ सकता है, और हमलावर गोल को नहीं मार सकता है।

तो गेम थ्योरी के अनुसार हमारा निष्कर्ष क्या है? बॉल गेम को "मल्टी-बॉल" तरीके से समाप्त किया जाना चाहिए, जहां हर मिनट एक-पर-एक खिलाड़ियों को एक अतिरिक्त बॉल/पक दिया जाता है जब तक कि एक पक्ष एक निश्चित परिणाम प्राप्त नहीं कर लेता, जो खिलाड़ियों के वास्तविक कौशल का संकेत है, और कोई शानदार आकस्मिक संयोग नहीं.

दिन के अंत में, गेम को अधिक स्मार्ट बनाने के लिए गेम थ्योरी का उपयोग किया जाना चाहिए। यानी यह बेहतर है.

खेल सिद्धांतसंचालन अनुसंधान की एक शाखा के रूप में, यह विभिन्न हितों वाले कई दलों की अनिश्चितता या संघर्ष की स्थितियों में इष्टतम निर्णय लेने के लिए गणितीय मॉडल का सिद्धांत है। गेम थ्योरी गेमिंग स्थितियों में इष्टतम रणनीतियों का अध्ययन करती है। इनमें वैज्ञानिक और आर्थिक प्रयोगों की एक प्रणाली, संगठन के लिए सबसे लाभदायक उत्पादन समाधानों की पसंद से संबंधित स्थितियाँ शामिल हैं सांख्यिकीय नियंत्रण, औद्योगिक उद्यमों और अन्य क्षेत्रों के बीच आर्थिक संबंध। औपचारिकता संघर्ष की स्थितियाँगणितीय रूप से, उन्हें दो, तीन आदि के खेल के रूप में दर्शाया जा सकता है। खिलाड़ी, जिनमें से प्रत्येक दूसरे की कीमत पर अपने लाभ, अपनी जीत को अधिकतम करने का लक्ष्य रखता है।

"गेम थ्योरी" खंड को तीन द्वारा दर्शाया गया है ऑनलाइन कैलकुलेटर:

  1. खिलाड़ियों की इष्टतम रणनीतियाँ। ऐसी समस्याओं में, एक भुगतान मैट्रिक्स निर्दिष्ट किया जाता है। खिलाड़ियों की शुद्ध या मिश्रित रणनीतियों को ढूंढना आवश्यक है और, खेल की कीमत. हल करने के लिए, आपको मैट्रिक्स का आयाम और समाधान विधि निर्दिष्ट करनी होगी। सेवा कार्यान्वित होती है निम्नलिखित विधियाँदो खिलाड़ियों वाले खेल का समाधान:
    1. मिनीमैक्स। यदि आपको खिलाड़ियों की शुद्ध रणनीति का पता लगाना है या गेम के सैडल पॉइंट के बारे में किसी प्रश्न का उत्तर देना है, तो इस समाधान पद्धति को चुनें।
    2. सिम्प्लेक्स विधि. रैखिक प्रोग्रामिंग विधियों का उपयोग करके मिश्रित रणनीति गेम को हल करने के लिए उपयोग किया जाता है।
    3. ग्राफ़िक विधि. मिश्रित रणनीति गेम को हल करने के लिए उपयोग किया जाता है। यदि कोई काठी बिंदु है, तो समाधान रुक जाता है। उदाहरण: किसी दिए गए भुगतान मैट्रिक्स के लिए, खिलाड़ियों की इष्टतम मिश्रित रणनीतियों और उपयोग करने वाले गेम की कीमत का पता लगाएं ग्राफ़िक विधिखेल समाधान.
    4. ब्राउन-रॉबिन्सन पुनरावृत्त विधि. पुनरावृत्तीय विधि का उपयोग तब किया जाता है जब ग्राफिकल विधि लागू नहीं होती है और जब बीजगणितीय और मैट्रिक्स तरीके. यह विधि खेल की कीमत का अनुमानित मूल्य देती है, और सही मूल्य सटीकता की किसी भी वांछित डिग्री के साथ प्राप्त किया जा सकता है। यह विधि इष्टतम रणनीतियों को खोजने के लिए पर्याप्त नहीं है, लेकिन यह आपको बारी-आधारित गेम की गतिशीलता को ट्रैक करने और प्रत्येक चरण में प्रत्येक खिलाड़ी के लिए गेम की लागत निर्धारित करने की अनुमति देती है।
    उदाहरण के लिए, कार्य ऐसा लग सकता है जैसे "पेऑफ मैट्रिक्स द्वारा दिए गए खेल के लिए खिलाड़ियों की इष्टतम रणनीतियों को इंगित करें".
    सभी विधियाँ प्रमुख पंक्तियों और स्तंभों की जाँच का उपयोग करती हैं।
  2. बिमैट्रिक्स गेम। आमतौर पर ऐसे खेल में पहले और दूसरे खिलाड़ियों के भुगतान के समान आकार के दो मैट्रिक्स निर्दिष्ट किए जाते हैं। इन मैट्रिक्स की पंक्तियाँ पहले खिलाड़ी की रणनीतियों के अनुरूप होती हैं, और मैट्रिक्स के कॉलम दूसरे खिलाड़ी की रणनीतियों के अनुरूप होते हैं। इस मामले में, पहला मैट्रिक्स पहले खिलाड़ी की जीत का प्रतिनिधित्व करता है, और दूसरा मैट्रिक्स दूसरे की जीत का प्रतिनिधित्व करता है।
  3. प्रकृति के साथ खेल. जब आपको चयन करने की आवश्यकता हो तब उपयोग किया जाता है प्रबंधन निर्णयमैक्सिमैक्स, बेयस, लाप्लास, वाल्ड, सैवेज, हर्विट्ज़ के मानदंडों के अनुसार।
    बेयस मानदंड के लिए, घटित होने वाली घटनाओं की संभावनाओं को दर्ज करना भी आवश्यक होगा। यदि वे निर्दिष्ट नहीं हैं, तो डिफ़ॉल्ट मान छोड़ दें (समकक्ष घटनाएँ होंगी)।
    हर्विट्ज़ मानदंड के लिए, आशावाद के स्तर को इंगित करें। यदि यह पैरामीटर शर्तों में निर्दिष्ट नहीं है, तो आप मान 0, 0.5 और 1 का उपयोग कर सकते हैं।

कई समस्याओं के लिए कंप्यूटर का उपयोग करके समाधान खोजने की आवश्यकता होती है। उपरोक्त सेवाएँ और कार्य उपकरण में से एक हैं।



साइट पर नया

>

सबसे लोकप्रिय