বাড়ি প্রতিরোধ গাণিতিক খেলা তত্ত্ব। জীবন থেকে গেম রেকর্ডিং এবং সমাধানের উদাহরণ

গাণিতিক খেলা তত্ত্ব। জীবন থেকে গেম রেকর্ডিং এবং সমাধানের উদাহরণ

যদি বেশ কয়েকটি বিবাদমান পক্ষ (ব্যক্তি) থাকে, যার প্রত্যেকটি নির্দিষ্ট নিয়মের সেট দ্বারা নির্ধারিত একটি নির্দিষ্ট সিদ্ধান্ত নেয় এবং প্রতিটি ব্যক্তিই প্রতিটি পক্ষের জন্য পূর্বনির্ধারিত অর্থ প্রদানের সাথে সংঘর্ষের পরিস্থিতির চূড়ান্ত অবস্থা জানে, তাহলে একটি খেলা সঞ্চালিত বলা হয়.

গেম থিওরির কাজ হল প্রদত্ত খেলোয়াড়ের জন্য আচরণের একটি লাইন বেছে নেওয়া, যেখান থেকে বিচ্যুতি শুধুমাত্র তার জয়কে কমিয়ে দিতে পারে।

গেমের কিছু সংজ্ঞা

খেলার ফলাফলের পরিমাণগত মূল্যায়নকে অর্থপ্রদান বলা হয়।

দ্বিগুণ (দুই ব্যক্তি) একটি শূন্য-সমষ্টি খেলা বলা হয় যদি অর্থপ্রদানের যোগফল শূন্য হয়, যেমন যদি একজন খেলোয়াড়ের ক্ষতি অন্যের লাভের সমান হয়।

সম্ভাব্য প্রতিটি পরিস্থিতিতে একজন খেলোয়াড়ের পছন্দের একটি দ্ব্যর্থহীন বর্ণনাকে বলা হয় যেখানে তাকে ব্যক্তিগত পদক্ষেপ নিতে হবে। খেলোয়াড়ের কৌশল .

একজন খেলোয়াড়ের কৌশলকে সর্বোত্তম বলা হয় যদি, যখন খেলাটি বহুবার পুনরাবৃত্তি করা হয়, এটি খেলোয়াড়কে সর্বোচ্চ সম্ভাব্যতা প্রদান করে। গড় জয়(বা, যা একই জিনিস, সর্বনিম্ন সম্ভাব্য গড় জয়)।

একটি ম্যাট্রিক্স দ্বারা সংজ্ঞায়িত খেলা থাকা মিলাইন এবং nকলামগুলিকে মাত্রার একটি সীমিত জোড়া খেলা বলা হয় মি* n;

কোথায় i=
- কৌশল সহ প্রথম খেলোয়াড়ের কৌশল; j=- এন কৌশল থাকা দ্বিতীয় খেলোয়াড়ের কৌশল; ij- প্রথম খেলোয়াড়ের জয় iদ্বিতীয় দ্বারা ব্যবহৃত যখন কৌশল jতম কৌশল (বা, একই জিনিস কি, দ্বিতীয়টির ক্ষতি j-ম কৌশল, যখন প্রথম ব্যবহার করা হয় iম);

ক =  ij – গেমের পেমেন্ট ম্যাট্রিক্স।

1.1 বিশুদ্ধ কৌশল নিয়ে খেলা

কম খেলার মূল্য (প্রথম খেলোয়াড়ের জন্য)

= সর্বোচ্চ (মিনিট ij). (1.2)

i j

শীর্ষ খেলার মূল্য (দ্বিতীয় খেলোয়াড়ের জন্য):

= মিনিট (সর্বোচ্চ ij) . (1.3)

জে i

যদি = , গেমটিকে একটি স্যাডল পয়েন্ট গেম (1.4) বা বিশুদ্ধ কৌশল সহ একটি খেলা বলা হয়। যার মধ্যে ভি = = একটি মূল্যবান খেলা বলা হয় ( ভি- গেমের দাম)।

উদাহরণ। 2-ব্যক্তি গেম A-এর পেমেন্ট ম্যাট্রিক্স দেওয়া আছে। নির্ধারণ করুন সর্বোত্তম কৌশলপ্রতিটি খেলোয়াড় এবং গেমের মূল্যের জন্য:

(1.4)

সর্বোচ্চ 10 9 12 6

i

মিনিট 6

j

- প্রথম খেলোয়াড়ের কৌশল (সারি)।

দ্বিতীয় প্লেয়ার কৌশল (কলাম)।

- খেলার দাম।

সুতরাং, গেমটির একটি স্যাডল পয়েন্ট রয়েছে। কৌশল j = 4 - দ্বিতীয় খেলোয়াড়ের জন্য সর্বোত্তম কৌশল i=2 - প্রথমটির জন্য। আমরা বিশুদ্ধ কৌশল সঙ্গে একটি খেলা আছে.

1.2 মিশ্র কৌশল সহ গেম

যদি পেমেন্ট ম্যাট্রিক্সের একটি স্যাডল পয়েন্ট না থাকে, যেমন
, এবং গেমের কেউ তাদের সর্বোত্তম কৌশল হিসাবে একটি পরিকল্পনা বেছে নিতে পারে না, খেলোয়াড়রা "মিশ্র কৌশল" এ স্যুইচ করে। তাছাড়া, প্রতিটি খেলোয়াড় খেলা চলাকালীন তার প্রতিটি কৌশল বেশ কয়েকবার ব্যবহার করে।

একটি ভেক্টর, যার প্রতিটি উপাদান প্লেয়ারের সংশ্লিষ্ট বিশুদ্ধ কৌশল ব্যবহারের আপেক্ষিক ফ্রিকোয়েন্সি দেখায়, এই প্লেয়ারের মিশ্র কৌশল বলা হয়।

এক্স= (এক্স 1 …এক্স i …এক্স মি) – প্রথম খেলোয়াড়ের মিশ্র কৌশল।

= ( 1 ...y j ...y n) – দ্বিতীয় খেলোয়াড়ের মিশ্র কৌশল।

এক্সi , y j- খেলোয়াড়দের আপেক্ষিক ফ্রিকোয়েন্সি (সম্ভাবনা) তাদের কৌশল ব্যবহার করে।

মিশ্র কৌশল ব্যবহার করার জন্য শর্ত

. (1.5)

যদি এক্স* = (এক্স 1 * ….এক্সআমি*... এক্স মি*) - প্রথম খেলোয়াড় দ্বারা নির্বাচিত সর্বোত্তম কৌশল; Y* = ( 1 * …জে*... n*) দ্বিতীয় প্লেয়ার দ্বারা নির্বাচিত সর্বোত্তম কৌশল, তারপর সংখ্যাটি গেমের খরচ।

(1.6)

নম্বরের জন্য ভিখেলার দাম ছিল, এবং এক্স* এবং * - সর্বোত্তম কৌশল, বৈষম্যগুলি সন্তুষ্ট করার জন্য এটি প্রয়োজনীয় এবং যথেষ্ট

(1.7)

যদি খেলোয়াড়দের মধ্যে একজন সর্বোত্তম মিশ্র কৌশল ব্যবহার করে, তাহলে তার পারিশ্রমিক খেলার খরচের সমান ভিযে ফ্রিকোয়েন্সি সহ দ্বিতীয় প্লেয়ার সর্বোত্তম একটি অন্তর্ভুক্ত কৌশল ব্যবহার করবে নির্বিশেষে, বিশুদ্ধ কৌশল সহ।

লিনিয়ার প্রোগ্রামিং সমস্যা গেম তত্ত্ব সমস্যা হ্রাস.

উদাহরণ. পেঅফ ম্যাট্রিক্স দ্বারা সংজ্ঞায়িত গেমের একটি সমাধান খুঁজুন .

ক = (1.8)

y 1 y 2 y 3

সমাধান:

রৈখিক প্রোগ্রামিং সমস্যার একটি দ্বৈত জোড়া তৈরি করা যাক।

প্রথম খেলোয়াড়ের জন্য

(1.9)

1 + 2 + 3 = 1 (1.10)

পরিবর্তনশীল থেকে নিজেকে মুক্ত করা ভি(গেমের মূল্য), এক্সপ্রেশনের বাম এবং ডান দিক (1.9), (1.10) ভাগ করুন ভি. গ্রহণ করে j /ভিএকটি নতুন ভেরিয়েবলের জন্য z i, আমরা পেতে নতুন সিস্টেমসীমাবদ্ধতা (1.11) এবং লক্ষ্য ফাংশন (1.12)

(1.11)

. (1.12)

একইভাবে, আমরা দ্বিতীয় প্লেয়ারের জন্য গেম মডেলটি পাই:

(1.13)

এক্স 1 +এক্স 2 +এক্স 3 = 1 . (1.14)

মডেল (1.13), (1.14) একটি ভেরিয়েবল ছাড়া একটি ফর্ম কমানো ভি, আমরা পেতে

(1.15)

, (1.16)

কোথায়
.

আমাদের যদি প্রথম খেলোয়াড়ের আচরণের কৌশল নির্ধারণ করতে হয়, যেমন তার কৌশল ব্যবহারের আপেক্ষিক ফ্রিকোয়েন্সি ( এক্স 1 ….এক্স i …এক্স মি), আমরা দ্বিতীয় প্লেয়ার মডেল ব্যবহার করব, কারণ এই ভেরিয়েবলগুলি তার পেঅফ মডেলে (1.13), (1.14)।

আসুন (1.15), (1.16) ক্যানোনিকাল ফর্মে কমিয়ে দেই

(1.17)

লক্ষ্য করুন!আপনার নির্দিষ্ট সমস্যার সমাধান নীচে উপস্থাপিত সমস্ত টেবিল, ব্যাখ্যামূলক পাঠ্য এবং পরিসংখ্যান সহ এই উদাহরণের মতোই দেখাবে, তবে আপনার প্রাথমিক ডেটা বিবেচনা করে...

কাজ:
ম্যাট্রিক্স গেমটি নিম্নলিখিত পেঅফ ম্যাট্রিক্স দ্বারা দেওয়া হয়:

কৌশল "বি"
কৌশল "এ" খ ঘখ 2
ক ঘ 3 5
ক 2 6
3
2

ম্যাট্রিক্স গেমের সমাধান খুঁজুন, যথা:
- গেমের শীর্ষ মূল্য খুঁজুন;
- কম দামেগেম
- গেমের নেট মূল্য;
- খেলোয়াড়দের সর্বোত্তম কৌশল নির্দেশ করে;
-আনো গ্রাফিক সমাধান(জ্যামিতিক ব্যাখ্যা), যদি প্রয়োজন হয়।

ধাপ 1

আসুন গেমটির কম দাম নির্ধারণ করি - α

সর্বনিম্ন খেলা মূল্যα হল সর্বাধিক জয় যা আমরা একটি যুক্তিসঙ্গত প্রতিপক্ষের বিরুদ্ধে একটি খেলায় নিজেদের নিশ্চিত করতে পারি যদি আমরা পুরো খেলা জুড়ে একটি এবং শুধুমাত্র একটি কৌশল ব্যবহার করি (এই কৌশলটিকে "বিশুদ্ধ" বলা হয়)।

আসুন পেমেন্ট ম্যাট্রিক্সের প্রতিটি সারিতে খুঁজে বের করি সর্বনিম্নউপাদান এবং এটি একটি অতিরিক্ত কলামে লিখুন (নির্বাচিত হলুদসারণি 1 দেখুন)।

তারপর আমরা খুঁজে বের করব সর্বোচ্চঅতিরিক্ত কলামের উপাদান (একটি তারকাচিহ্ন দিয়ে চিহ্নিত), এটি গেমের কম দাম হবে।

1 নং টেবিল

কৌশল "বি"
কৌশল "এ" খ ঘখ 2 সারি মিনিমা
ক ঘ 3 5 3 *
ক 2 6
3
2
3
2

আমাদের ক্ষেত্রে, গেমটির কম দাম হল: α = 3, এবং একটি জয়ের নিশ্চয়তা দিতে হলে 3 এর চেয়ে খারাপ হবে না আমাদের কৌশল A 1-এ লেগে থাকতে হবে

ধাপ ২

গেমের উপরের দাম নির্ধারণ করা যাক - β

শীর্ষ খেলা মূল্যβ হল সর্বনিম্ন ক্ষতি যে খেলোয়াড় B একটি যুক্তিসঙ্গত প্রতিপক্ষের বিরুদ্ধে খেলায় নিজেকে নিশ্চিত করতে পারে যদি সে পুরো খেলা জুড়ে একটি এবং শুধুমাত্র একটি কৌশল ব্যবহার করে।

আসুন পেমেন্ট ম্যাট্রিক্সের প্রতিটি কলামে খুঁজে দেখি সর্বোচ্চউপাদান এবং নীচের একটি অতিরিক্ত লাইনে এটি লিখুন (হলুদে হাইলাইট, সারণি 2 দেখুন)।

তারপর আমরা খুঁজে বের করব সর্বনিম্নঅতিরিক্ত লাইনের উপাদান (একটি প্লাস দিয়ে চিহ্নিত), এটি হবে গেমের উপরের দাম।

টেবিল ২

কৌশল "বি"
কৌশল "এ" খ ঘখ 2 সারি মিনিমা
ক ঘ 3 5 3 *
ক 2 6
3
2

আমাদের ক্ষেত্রে, গেমের উপরের দাম হল: β = 5, এবং 5 এর চেয়ে খারাপ ক্ষতির গ্যারান্টি দেওয়ার জন্য, প্রতিপক্ষকে (খেলোয়াড় "B") অবশ্যই B 2 কৌশল মেনে চলতে হবে

ধাপ 3
আসুন গেমের নিম্ন এবং উপরের দামের তুলনা করি; এই সমস্যায় তারা আলাদা, যেমন α ≠ β, পেঅফ ম্যাট্রিক্সে একটি স্যাডল পয়েন্ট থাকে না। এর মানে হল যে গেমটির খাঁটি মিনিম্যাক্স কৌশলগুলিতে কোনও সমাধান নেই, তবে এটির মিশ্র কৌশলগুলিতে সর্বদা একটি সমাধান রয়েছে।

মিশ্র কৌশল, এগুলি নির্দিষ্ট সম্ভাব্যতা (ফ্রিকোয়েন্সি) সহ এলোমেলোভাবে পরিবর্তিত বিশুদ্ধ কৌশল।

আমরা প্লেয়ার "A" এর মিশ্র কৌশল নির্দেশ করব

এসক =

যেখানে B 1, B 2 হল প্লেয়ার "B" এর কৌশল এবং q 1, q 2 হল যথাক্রমে, সম্ভাব্যতা যার সাথে এই কৌশলগুলি প্রয়োগ করা হয়েছে এবং q 1 + q 2 = 1৷

প্লেয়ার "A" এর জন্য সর্বোত্তম মিশ্র কৌশল হল তাকে সর্বোচ্চ অর্থ প্রদান করে। তদনুসারে, "B" এর জন্য একটি সর্বনিম্ন ক্ষতি রয়েছে। এই কৌশল মনোনীত করা হয় এসক* এবং এসবি* যথাক্রমে। একজোড়া সর্বোত্তম কৌশল গেমের একটি সমাধান তৈরি করে।

ভিতরে সাধারণ ক্ষেত্রেপ্লেয়ারের সর্বোত্তম কৌশল সব প্রাথমিক কৌশল অন্তর্ভুক্ত নাও হতে পারে, কিন্তু শুধুমাত্র কিছু. এই ধরনের কৌশল বলা হয় সক্রিয় কৌশল.

ধাপ: 4


কোথায়: পি 1 , পি 2 - সম্ভাব্যতা (ফ্রিকোয়েন্সি) যার সাথে যথাক্রমে A 1 এবং A 2 প্রয়োগ করা হয়

গেম তত্ত্ব থেকে জানা যায় যে যদি খেলোয়াড় "A" তার সর্বোত্তম কৌশল ব্যবহার করে এবং খেলোয়াড় "B" তার সক্রিয় কৌশলগুলির কাঠামোর মধ্যে থাকে, তাহলে গড় বেতন অপরিবর্তিত থাকে এবং খেলার খরচের সমান হয়। vখেলোয়াড় "B" তার সক্রিয় কৌশলগুলি কীভাবে ব্যবহার করে তা নির্বিশেষে। এবং আমাদের ক্ষেত্রে, উভয় কৌশলই সক্রিয়, অন্যথায় গেমটির বিশুদ্ধ কৌশলগুলিতে একটি সমাধান থাকবে। অতএব, যদি আমরা ধরে নিই যে প্লেয়ার "B" একটি বিশুদ্ধ কৌশল B 1 ব্যবহার করবে, তাহলে গড় বেতন vহবে:

k 11 p 1 + k 21 p 2 = v (1)

কোথায়: k ij - পেমেন্ট ম্যাট্রিক্সের উপাদান।

অন্যদিকে, যদি আমরা ধরে নিই যে প্লেয়ার "B" একটি বিশুদ্ধ কৌশল B 2 ব্যবহার করবে, তাহলে গড় বেতন হবে:

k 12 p 1 + k 22 p 2 = v (2)

সমীকরণ (1) এবং (2) এর বাম দিকের সমীকরণ করে আমরা পাই:

k 11 p 1 + k 21 p 2 = k 12 p 1 + k 22 p 2

আর সেই বিষয়টি আমলে নিয়ে ড পি 1 + পি 2 = 1 আমাদের আছে:

k 11 p 1 + k 21 (1 - p 1 ) = k 12 p 1 + k 22 (1 - p 1 )


যেখানে কৌশল A 1 এর সর্বোত্তম ফ্রিকোয়েন্সি খুঁজে পাওয়া সহজ:
পি 1 =
k 22 - k 21
k 11 + k 22 - k 12 - k 21
(3)

এই কাজে:

পি 1 =
3
2
- 6
3 +
3
2
- 5 - 6
=
9
13

সম্ভাবনা আর 2 বিয়োগ দ্বারা খুঁজুন আর 1 ইউনিট থেকে:
পি 2 = 1 - পি 1 = 1 -
9
13
= + 6 ·

কোথায়: q 1 , q 2 - সম্ভাব্যতা (ফ্রিকোয়েন্সি) যার সাথে যথাক্রমে B 1 এবং B 2 কৌশল প্রয়োগ করা হয়

গেম তত্ত্ব থেকে জানা যায় যে যদি খেলোয়াড় "B" তার সর্বোত্তম কৌশল ব্যবহার করে এবং খেলোয়াড় "A" তার সক্রিয় কৌশলগুলির কাঠামোর মধ্যে থাকে, তাহলে গড় পারিশ্রমিক অপরিবর্তিত থাকে এবং খেলার খরচের সমান হয়। vখেলোয়াড় A কিভাবে তার সক্রিয় কৌশল ব্যবহার করে তা নির্বিশেষে। অতএব, যদি আমরা ধরে নিই যে প্লেয়ার "A" একটি বিশুদ্ধ কৌশল A 1 ব্যবহার করবে, তাহলে গড় বেতন vহবে:

k 11 q 1 + k 12 q 2 = v (4)


যেহেতু গেমটির দাম v আমরা ইতিমধ্যে জানি এবং বিবেচনা q 1 + q 2 = 1 , তারপর কৌশল B 1 এর সর্বোত্তম ফ্রিকোয়েন্সিটি পাওয়া যাবে:
q 1 =
v - k 12
k 11 - k 12
(5)

এই কাজে:

q 1 =
51
13
- 5
3 - 5
=
7
13

সম্ভাবনা q 2 বিয়োগ দ্বারা খুঁজুন q 1 ইউনিট থেকে:
q 2 = 1 - q 1 = 1 -
7
13
=
6
13

উত্তর:

সর্বনিম্ন খেলা মূল্য: α = 3
শীর্ষ গেম মূল্য: β = 5
খেলার মূল্য: v =
51
13
প্লেয়ার এ এর ​​সর্বোত্তম কৌশল:
এস A*=
ক ঘক 2
9
13
4
13

প্লেয়ার "বি" এর জন্য সর্বোত্তম কৌশল:
এসবি*=
খ ঘখ 2
7
13
6
13

জ্যামিতিক ব্যাখ্যা (গ্রাফিক্যাল সমাধান):

আসুন বিবেচনা করা খেলাটির একটি জ্যামিতিক ব্যাখ্যা দেওয়া যাক। একক দৈর্ঘ্যের অ্যাবসিসা অক্ষের একটি অংশ নিন এবং এর প্রান্ত দিয়ে উল্লম্ব সরল রেখা আঁকুন 1 এবং 2 আমাদের কৌশল A 1 এবং A 2 এর সাথে সম্পর্কিত। আসুন এখন ধরে নিই যে প্লেয়ার "B" কৌশল B 1 in ব্যবহার করবে বিশুদ্ধ ফর্ম. তারপর, যদি আমরা (খেলোয়াড় "A") একটি বিশুদ্ধ কৌশল A 1 ব্যবহার করি, তাহলে আমাদের বেতন হবে 3। চলুন অক্ষের সংশ্লিষ্ট বিন্দুটিকে চিহ্নিত করি 1 .
যদি আমরা বিশুদ্ধ কৌশল A 2 ব্যবহার করি, তাহলে আমাদের পে-অফ হবে 6। আসুন অক্ষের সংশ্লিষ্ট বিন্দুটিকে চিহ্নিত করি। 2
(চিত্র 1 দেখুন)। স্পষ্টতই, যদি আমরা প্রয়োগ করি, বিভিন্ন অনুপাতে কৌশল A 1 এবং A 2 মিশ্রিত করা, আমাদের জয়গুলি স্থানাঙ্ক (0, 3) এবং (1, 6) সহ বিন্দুগুলির মধ্য দিয়ে যাওয়া একটি সরল রেখা বরাবর পরিবর্তিত হবে, আসুন এটিকে কৌশল B এর লাইন বলি। 1 (চিত্রে .1 লাল রঙে দেখানো হয়েছে)। প্রদত্ত রেখার যেকোন বিন্দুর অ্যাবসিসা সম্ভাব্যতার সমান পি 2 (ফ্রিকোয়েন্সি) যার সাথে আমরা কৌশল A 2 প্রয়োগ করি এবং অর্ডিনেট - ফলে লাভ k (চিত্র 1 দেখুন)।

ছবি 1।
পরিশোধ গ্রাফ k ফ্রিকোয়েন্সি থেকে পৃ 2 , যখন শত্রু কৌশল ব্যবহার করে খ ঘ.

আসুন এখন ধরে নিই যে প্লেয়ার "B" তার বিশুদ্ধ আকারে কৌশল B 2 ব্যবহার করবে। তারপর, যদি আমরা (খেলোয়াড় “A”) বিশুদ্ধ কৌশল A 1 ব্যবহার করি, তাহলে আমাদের পেঅফ হবে 5। আমরা যদি বিশুদ্ধ কৌশল A 2 ব্যবহার করি, তাহলে আমাদের পেঅফ হবে 3/2 (চিত্র 2 দেখুন)। একইভাবে, যদি আমরা বিভিন্ন অনুপাতে কৌশল A 1 এবং A 2 মিশ্রিত করি, তাহলে আমাদের জয়গুলি স্থানাঙ্ক (0, 5) এবং (1, 3/2) সহ পয়েন্টগুলির মধ্য দিয়ে যাওয়া একটি সরল রেখা বরাবর পরিবর্তিত হবে, আসুন একে কৌশলের লাইন বলি। খ 2. আগের ক্ষেত্রে যেমন, এই লাইনের যেকোন বিন্দুর অ্যাবসিসা সেই সম্ভাব্যতার সমান যার সাথে আমরা কৌশল A 2 প্রয়োগ করি এবং অর্ডিনেট হল ফলস্বরূপ লাভ, কিন্তু শুধুমাত্র B 2 কৌশলের জন্য (চিত্র 2 দেখুন)।

চিত্র ২.
v এবং সর্বোত্তম ফ্রিকোয়েন্সি পৃ 2 খেলোয়াড়ের জন্য "ক".

একটি বাস্তব খেলায়, যখন একজন যুক্তিসঙ্গত খেলোয়াড় “B” তার সমস্ত কৌশল ব্যবহার করে, তখন আমাদের জয়গুলি চিত্র 2-এ লাল রঙে দেখানো ভাঙা লাইন বরাবর পরিবর্তিত হবে। এই লাইন তথাকথিত সংজ্ঞায়িত করে জয়ের নিম্ন সীমা. স্পষ্টতই সবচেয়ে বেশি উচ্চ বিন্দুএই ভাঙা লাইনটি আমাদের সর্বোত্তম কৌশলের সাথে মিলে যায়। ভিতরে এক্ষেত্রে, এটি হল B 1 এবং B 2 কৌশলগুলির লাইনের ছেদ বিন্দু। আপনি একটি ফ্রিকোয়েন্সি নির্বাচন যদি দয়া করে নোট করুন পি 2 এর abscissa এর সমান, তাহলে আমাদের লাভ অপরিবর্তিত এবং সমান থাকবে v প্লেয়ার "বি" এর যেকোন কৌশলের জন্য, উপরন্তু, এটি সর্বোচ্চ হবে যে আমরা নিজেদের গ্যারান্টি দিতে পারি। ফ্রিকোয়েন্সি (সম্ভাব্যতা) পি 2 , এই ক্ষেত্রে, আমাদের সর্বোত্তম মিশ্র কৌশলের সংশ্লিষ্ট ফ্রিকোয়েন্সি। যাইহোক, চিত্র 2 থেকে আপনি ফ্রিকোয়েন্সি দেখতে পারেন পি 1 , আমাদের সর্বোত্তম মিশ্র কৌশল, সেগমেন্টের দৈর্ঘ্য [ পি 2 ; 1] x-অক্ষে। (ইহার কারণ পি 1 + পি 2 = 1 )

সম্পূর্ণ অনুরূপ যুক্তি ব্যবহার করে, আমরা প্লেয়ার "B" এর জন্য সর্বোত্তম কৌশলের ফ্রিকোয়েন্সি খুঁজে পেতে পারি, যা চিত্র 3 এ দেখানো হয়েছে।

চিত্র 3।
গেমের দামের গ্রাফিক নির্ধারণ v এবং সর্বোত্তম ফ্রিকোয়েন্সি q 2 খেলোয়াড়ের জন্য "ভিতরে".

শুধুমাত্র তার জন্য তথাকথিত উচিত সর্বোচ্চ সীমাহারানো(লাল ভাঙা লাইন) এবং এটিতে সর্বনিম্ন বিন্দু সন্ধান করুন, কারণ প্লেয়ার "বি" এর লক্ষ্য হল ক্ষতি কমানো। একই ফ্রিকোয়েন্সি মান q 1 , এটি সেগমেন্টের দৈর্ঘ্য [ q 2 ; 1] x-অক্ষে।

বিষয়বস্তু 1 সাধারণ জ্ঞাতব্য 2 1.1 গেম। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 চালনা। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 কৌশল। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.4 ম্যাট্রিক্স খেলা। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2 ট্রেইল পয়েন্ট। বিশুদ্ধ কৌশল 7 2.1 উদাহরণ। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 উদাহরণ 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 উদাহরণ 2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 মিশ্র কৌশল 9 3.1 গেম 2×2। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.1.1 উদাহরণ। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 উদাহরণ 3. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 উদাহরণ 4. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.1.2 জ্যামিতিক ব্যাখ্যা। . . . . . . . . . . . . . . . . . . . 12 3.2 গেম 2×n এবং m×2। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 উদাহরণ 5। . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1 1. গেম থিওরি থেকে সাধারণ তথ্য 1.1। গেমস গেম তত্ত্ব হল দ্বন্দ্ব পরিস্থিতির একটি গাণিতিক তত্ত্ব, যেমন যে পরিস্থিতিতে দুই বা ততোধিক পক্ষের স্বার্থ বিভিন্ন লক্ষ্য অনুসরণ করে সংঘর্ষ হয়। একটি গেম হল একটি দ্বন্দ্ব পরিস্থিতি যা নির্দিষ্ট নিয়ম দ্বারা নিয়ন্ত্রিত হয়, যা অবশ্যই নির্দেশ করে: অংশগ্রহণকারীদের ক্রিয়াকলাপের জন্য সম্ভাব্য বিকল্পগুলি; খেলার পরিমাণগত ফলাফল বা অর্থপ্রদান (জয়, পরাজয়) যার দিকে প্রদত্ত পদক্ষেপের সেট বাড়ে; তথ্যের পরিমাণ একে অপরের আচরণ সম্পর্কে প্রতিটি পক্ষের। একটি দ্বৈত খেলা এমন একটি খেলা যেখানে শুধুমাত্র দুটি দল (দুই খেলোয়াড়) অংশগ্রহণ করে। একটি জিরো-সম পেয়ারড গেম হল একটি পেয়ারড গেম যেখানে পেমেন্টের যোগফল শূন্য, অর্থাৎ একজন খেলোয়াড়ের ক্ষতি দ্বিতীয়টির লাভের সমান। পেঅফ ফাংশনের মূল্যের প্রতি প্রতিটি খেলোয়াড়ের মনোভাবের উপর নির্ভর করে, পেয়ার করা গেমগুলিকে উপবিভক্ত করা হয়: জিরো-সম পেয়ারড গেম (বিরোধী) - একটি পেয়ার করা গেম যাতে পেয়ারের পরিমাণ শূন্যের সমান হয়, অর্থাৎ একজন খেলোয়াড়ের ক্ষতি দ্বিতীয়টির লাভের সমান। একটি নন-অ্যান্টাগোনিস্টিক গেম হল একটি জুটিযুক্ত খেলা যেখানে খেলোয়াড়রা ভিন্ন ভিন্ন, কিন্তু সরাসরি বিপরীত নয়, লক্ষ্য অনুসরণ করে। 2 1.2। মুভস মুভ - গেমের নিয়ম দ্বারা প্রদত্ত ক্রিয়াগুলির মধ্যে একটির পছন্দ; এই পছন্দের বাস্তবায়ন। চালগুলি দুই প্রকার: ব্যক্তিগত চালনা - + গেমের নিয়ম দ্বারা প্রদত্ত ক্রিয়াগুলির মধ্যে একটির সচেতন পছন্দ + বাস্তবায়ন এই পছন্দের র‍্যান্ডম চাল - একটি র‍্যান্ডম চাল হল বেশ কয়েকটি সম্ভাবনার একটি পছন্দ, যা খেলোয়াড়ের সিদ্ধান্তের দ্বারা পরিচালিত হয় না, বরং এলোমেলো নির্বাচনের কিছু প্রক্রিয়ার মাধ্যমে করা হয়। নীচে আমরা শুধুমাত্র ব্যক্তিগত চাল সমন্বিত শূন্য-সমষ্টির জোড়া গেম বিবেচনা করি। প্রতিটি পক্ষের অন্যের আচরণ সম্পর্কে তথ্যের অভাব রয়েছে। 3 1.3। কৌশলগুলি একজন খেলোয়াড়ের কৌশল হল নিয়মের একটি সেট যা এই খেলোয়াড়ের প্রতিটি ব্যক্তিগত পদক্ষেপের জন্য ক্রিয়াকলাপের পছন্দ নির্ধারণ করে, খেলা চলাকালীন উদ্ভূত পরিস্থিতির উপর নির্ভর করে। সম্ভাব্য কৌশলের সংখ্যার উপর নির্ভর করে, গেমগুলিকে সসীম এবং অসীমে ভাগ করা হয়। একটি অসীম খেলা এমন একটি খেলা যেখানে অন্তত একজন খেলোয়াড় থাকে অসীম সংখ্যাকৌশল একটি সীমিত খেলা এমন একটি খেলা যেখানে প্রতিটি খেলোয়াড়ের শুধুমাত্র একটি সীমিত সংখ্যক কৌশল থাকে। যেকোনো খেলোয়াড়ের ক্রমাগত চালের সংখ্যা গেমের একক-চাল এবং মাল্টি-মুভ, বা অবস্থানগত মধ্যে বিভাজন নির্ধারণ করে। + এক-টার্ন গেমে, প্রতিটি খেলোয়াড় সম্ভাব্য বিকল্পগুলি থেকে শুধুমাত্র একটি পছন্দ করে এবং তারপরে গেমের ফলাফল নির্ধারণ করে। + মাল্টি-মুভ, বা অবস্থানগত, গেমটি সময়ের সাথে সাথে বিকাশ করে, একটি সিরিজের প্রতিনিধিত্ব করে ধারাবাহিক পর্যায়, যার প্রত্যেকটি খেলোয়াড়দের একজনের স্থানান্তর এবং পরিস্থিতির সাথে সম্পর্কিত পরিবর্তনের পরে ঘটে। এক-পালা খেলায়, প্রতিটি খেলোয়াড় শুধুমাত্র একটি পছন্দ করে সম্ভাব্য বিকল্পএবং তারপর খেলার ফলাফল নির্ধারণ করে। একজন খেলোয়াড়ের সর্বোত্তম কৌশল হল এমন একটি কৌশল যা, যখন গেমটি অনেকবার পুনরাবৃত্তি করা হয়, তখন এই খেলোয়াড়কে সর্বোচ্চ সম্ভাব্য গড় জয় (অথবা, একই, সর্বনিম্ন সম্ভাব্য গড় হার) প্রদান করে। গেম তত্ত্বে, সমস্ত সুপারিশ খেলোয়াড়দের যুক্তিসঙ্গত আচরণের অনুমানের উপর ভিত্তি করে তৈরি করা হয়। খেলোয়াড়দের ভুল গণনা এবং ভুল, প্রতিটি সংঘর্ষের পরিস্থিতিতে অনিবার্য, সেইসাথে উত্তেজনা এবং ঝুঁকির উপাদানগুলিকে গেম তত্ত্বে বিবেচনা করা হয় না। 4 1.4। ম্যাট্রিক্স গেম একটি ম্যাট্রিক্স গেম একটি এক-চালিত সীমিত শূন্য-সমষ্টি গেম। একটি ম্যাট্রিক্স গেম একটি তাত্ত্বিক গেমিং মডেলদ্বন্দ্বের পরিস্থিতি যেখানে বিরোধীরা, ভিন্ন ভিন্ন লক্ষ্য অর্জনের জন্য, একটি সসীম সংখ্যা থেকে একটি পছন্দ (সরানো) করে সম্ভাব্য উপায়কর্ম। কর্মের নির্বাচিত পদ্ধতি (কৌশল) অনুসারে অর্জিত ফলাফল নির্ধারণ করা হয়। এর একটি উদাহরণ তাকান. দুটি খেলোয়াড় এ এবং বি থাকতে দিন, যাদের মধ্যে একজন বেছে নিতে পারেন i-th কৌশল এম এর সম্ভাব্য কৌশল A1, A2, ...Am থেকে এবং দ্বিতীয়টি তার সম্ভাব্য কৌশল B1, B2, ...Bm থেকে j-th কৌশল বেছে নেয়। ফলস্বরূপ, প্রথম খেলোয়াড়ের মান aij জিতে, এবং দ্বিতীয় খেলোয়াড় এই মান হারায়। aij সংখ্যা থেকে, আমরা একটি ম্যাট্রিক্স তৈরি করি   a11 a11 · · · a1n  a21 a22 · · · a2n    A = (aij) =  .. .. ..   । . . .  am1 am2 · · · amn ম্যাট্রিক্স A = (aij), i = 1, m, j = 1, n কে পেঅফ ম্যাট্রিক্স বা m × n গেম ম্যাট্রিক্স বলা হয়। এই ম্যাট্রিক্সে, সারিগুলি সর্বদা বিজয়ী (সর্বোচ্চ করা) খেলোয়াড় A-এর কৌশলগুলির জন্য থাকে, অর্থাৎ যে খেলোয়াড় তার জয়কে সর্বাধিক করার চেষ্টা করে। কলামগুলি হারানো খেলোয়াড় B এর কৌশলগুলির জন্য বরাদ্দ করা হয়, অর্থাৎ যে খেলোয়াড় দক্ষতার মাপকাঠি ছোট করার চেষ্টা করে। একটি খেলার স্বাভাবিকীকরণ হল একটি পজিশনাল গেমকে একটি ম্যাট্রিক্স গেমে কমিয়ে আনার প্রক্রিয়া। স্বাভাবিক আকারে একটি গেম হল একটি পজিশনাল গেম যা একটি ম্যাট্রিক্স গেমে কমিয়ে দেওয়া হয়। আমাদের স্মরণ করা যাক যে একটি পজিশনাল মাল্টি-মুভ গেম হল একটি গেম-থিওরিটিক মডেল। দ্বন্দ্ব পরিস্থিতি যেখানে বিরোধীরা এই পরিস্থিতির বিকাশের প্রতিটি পর্যায়ে একটি সীমিত সংখ্যক সম্ভাব্য পদক্ষেপ থেকে ক্রমান্বয়ে একটি পছন্দ (চালনা) করে। গেমটির সমাধান হল উভয় খেলোয়াড়ের সর্বোত্তম কৌশল খুঁজে বের করা এবং গেমের মূল্য নির্ধারণ করা। গেমের মূল্য হল খেলোয়াড়দের প্রত্যাশিত লাভ (ক্ষতি)। গেমের সমাধান হয় বিশুদ্ধ কৌশলের মধ্যে পাওয়া যেতে পারে - যখন খেলোয়াড়কে একটি একক কৌশল অনুসরণ করতে হবে, অথবা মিশ্র কৌশলগুলিতে, যখন খেলোয়াড়কে নির্দিষ্ট সম্ভাবনার সাথে দুটি বা ততোধিক বিশুদ্ধ কৌশল ব্যবহার করতে হবে। এই ক্ষেত্রে পরেরটিকে সক্রিয় বলা হয়। 5 এক প্লেয়ারের মিশ্র কৌশল হল একটি ভেক্টর, যার প্রতিটি উপাদান সংশ্লিষ্ট বিশুদ্ধ কৌশলের প্লেয়ার দ্বারা ব্যবহারের ফ্রিকোয়েন্সি দেখায়। গেমের ম্যাক্সিমিন বা কম দাম - সংখ্যা α = max min aij i j ম্যাক্সিমিন কৌশল (লাইন) - যে কৌশলটি খেলোয়াড় তার ন্যূনতম জয়কে সর্বাধিক করার জন্য বেছে নেয়। স্পষ্টতই, সবচেয়ে সতর্ক ম্যাক্সিমিন কৌশল বেছে নেওয়ার সময়, প্লেয়ার A নিজেকে (প্রতিপক্ষের আচরণ নির্বিশেষে) কমপক্ষে α এর গ্যারান্টিযুক্ত অর্থ প্রদান করে। গেমের ম্যাক্সিমিন বা উপরের দাম - সংখ্যা β = min max aij j i Minimax কৌশল (কলাম) - যে কৌশলটি খেলোয়াড় তার সর্বাধিক ক্ষতি কমাতে বেছে নেয়। স্পষ্টতই, সবচেয়ে সতর্ক মিনিম্যাক্স কৌশল বেছে নেওয়ার সময়, প্লেয়ার B কোনো পরিস্থিতিতেই, প্লেয়ার A-কে β-এর বেশি জিততে দেয় না। গেমের নিম্ন মূল্য সবসময় গেমের উপরের দামের চেয়ে বেশি হয় না α = max min aij 6 min max aij = β i j j i থিওরেম 1 (ম্যাট্রিক্স গেমের তত্ত্বের প্রধান উপপাদ্য)। প্রতিটি সীমিত গেমের অন্তত একটি সমাধান থাকে, সম্ভবত মিশ্র কৌশলের ক্ষেত্রে। 6 2. একটি স্যাডল পয়েন্ট সহ গেম। বিশুদ্ধ কৌশলে সমাধান একটি স্যাডল পয়েন্ট সহ একটি গেম হল এমন একটি খেলা যার জন্য α = সর্বোচ্চ min aij = min max aij = β i j j i একটি স্যাডল পয়েন্ট সহ গেমগুলির জন্য, একটি সমাধান খুঁজে বের করা হল সর্বাধিক এবং সর্বোত্তম কৌশলগুলি বেছে নেওয়া।, খেলার বিশুদ্ধ খরচ - সাধারণ অর্থগেমের নিম্ন এবং উপরের দাম α=β=ν 2.1। উদাহরণ উদাহরণ 1 ম্যাট্রিক্স   8 4 7 A= 6 5 9  7 7 8 সমাধান: গেমের উপরের এবং নিম্ন মূল্য নির্ধারণ করুন। এটি করার জন্য, আমরা সংখ্যার ন্যূনতম সংখ্যা খুঁজে পাই i-th লাইন αi = min aij j এবং jth কলামের সর্বাধিক সংখ্যা aij βj = max aij i আমরা একটি অতিরিক্ত কলাম আকারে ডানদিকে পেমেন্ট ম্যাট্রিক্সের পাশে αi (সারি মিনিমা) সংখ্যাগুলি লিখব। আমরা একটি অতিরিক্ত লাইন আকারে ম্যাট্রিক্সের অধীনে βi (কলাম ম্যাক্সিমা) সংখ্যাগুলি লিখি: αi 8 4 7 4 6 5 9 5 7 7 8 7 βj 8 7 9 7 সংখ্যাগুলির সর্বাধিক খুঁজুন αi α = সর্বোচ্চ αi = 7 i এবং সংখ্যার সর্বনিম্ন βj β = min βj = 7 j α = β - গেমটিতে একটি স্যাডল পয়েন্ট আছে। প্লেয়ারের জন্য সর্বোত্তম কৌশল হল কৌশল A3, এবং প্লেয়ার B হল কৌশল B2, নেট গেমের মূল্য ν = 7 উদাহরণ 2 পেমেন্ট ম্যাট্রিক্স দেওয়া হয়েছে:   2 2 1 1 2  0 1 1 1 1  A=  1 1 1 1 2   1 2 1 1 2 বিশুদ্ধ কৌশলে গেমটির একটি সমাধান খুঁজুন। সমাধান: 2 2 1 1 2 1 0 1 1 1 1 0 1 1 1 1 1 2 1 2 1 1 2 1 βj 2 2 1 1 2 α = β = 1। গেমটিতে ছয়টি স্যাডল পয়েন্ট রয়েছে। সর্বোত্তম কৌশলগুলি হবে: A1 এবং B3 বা B4 A3 এবং B3 বা B4 A4 এবং B3 বা B4 8 3. মিশ্র কৌশলগুলিতে গেমের সমাধান যখন α = β। ক্ষেত্রে যখন, তাদের কৌশলগুলি বেছে নেওয়ার সময়, উভয় খেলোয়াড়ের কাছে অন্যের পছন্দ সম্পর্কে কোনও তথ্য থাকে না, গেমটির মিশ্র কৌশলগুলিতে একটি সমাধান রয়েছে। SA = (p1, p2, ..., pm) - প্লেয়ার A-এর মিশ্র কৌশল, যেখানে A1, A2, ..., Am সম্ভাব্যতার সাথে প্রয়োগ করা হয় ∑ m p1, p2, ..., pm, pi = 1, pi > 0, i = 1, m i=1 SB = (q1, q2, ..., qn) - প্লেয়ার B-এর মিশ্র কৌশল, যেখানে B1, B2, ..., Bm সম্ভাব্যতার সাথে প্রয়োগ করা হয় ∑ n q1, q2 , ..., qm , qi = 1, qi > 0, i = 1, n i=1 যদি: SA∗ হল খেলোয়াড় A-এর সর্বোত্তম কৌশল, SB∗ হল খেলোয়াড় B-এর সর্বোত্তম কৌশল, তাহলে গেমটির খরচ হল ∑ n ∑ m ν = aij · p∗i · qi∗ j=1 i=1 নিচের উপপাদ্যটি 2 × 2, 2 × n, m × গেমগুলির জন্য কীভাবে একটি সমাধান খুঁজে পাওয়া যায় সেই প্রশ্নের উত্তর দেয় 2 উপপাদ্য 2 (কীভাবে 2 × 2, 2 × n, m × 2 গেমগুলির জন্য একটি সমাধান খুঁজে বের করা যায়)। যদি খেলোয়াড়দের মধ্যে একজন একটি সর্বোত্তম মিশ্র কৌশল ব্যবহার করে, তাহলে তার পারিশ্রমিকটি গেমের খরচের সমান হয় ν, সম্ভাব্যতা নির্বিশেষে যে দ্বিতীয় খেলোয়াড়টি সর্বোত্তম একটিতে অন্তর্ভুক্ত কৌশলগুলি ব্যবহার করবে (বিশুদ্ধ কৌশলগুলি সহ)। 9 3.1। গেম 2 × 2 ম্যাট্রিক্স সহ একটি 2 × 2 গেমটি বিবেচনা করুন: () a11 a21 a21 a22 বিশুদ্ধ কৌশলে গেমটির কোনও সমাধান নেই। আসুন আমরা SA∗ এবং SB∗ সর্বোত্তম কৌশলগুলি খুঁজে পাই। প্রথমত, আমরা কৌশলটি সংজ্ঞায়িত করি SA∗ = (p∗1 , p∗2)। উপপাদ্য অনুসারে, যদি পক্ষ A কৌশল ν মেনে চলে, তাহলে B পক্ষের ক্রিয়াকলাপ নির্বিশেষে, প্রতিদান ν খেলার খরচের সমান থাকবে। ফলস্বরূপ, যদি পাশ A সর্বোত্তম কৌশল SA∗ = (p∗1 , p∗2) মেনে চলে, তবে পার্শ্ব B তার অর্থপ্রদান পরিবর্তন না করেই তার যে কোনো কৌশল প্রয়োগ করতে পারে। তারপর, যখন খেলোয়াড় B বিশুদ্ধ কৌশল B1 বা B2 ব্যবহার করে, তখন খেলোয়াড় খেলার খরচের সমান একটি গড় পারিশ্রমিক পাবে: a11 p∗1 + a21 p∗2 = ν ← কৌশল B1 a12 p∗1 + a22 p∗ এর জন্য 2 = ν ← কৌশল B2 এর জন্য বিবেচনায় রাখলে p∗1 + p∗2 = 1: p∗1 = a2 2−a2 1 a11 +a22 −a12 −a21 p∗2 = a1 1−a1 2 a11 +a22 −a12 −a21 গেমের মূল্য: a22 a11 − a12 a21 ν= a11 + a22 − a12 − a21 প্লেয়ার B-এর সর্বোত্তম কৌশল একইভাবে পাওয়া যায়: SB∗ = (q1∗ , q2∗)। বিবেচনায় নেওয়া যে q1∗ + q2∗ = 1: q1∗ = a2 2−a1 2 a11 +a22 −a12 −a21 q2∗ = a1 1−a2 1 a11 +a22 −a12 −a21 3.1.1। উদাহরণ উদাহরণ 3 ম্যাট্রিক্স () −1 1 A= 1 −1 10 দিয়ে গেমের একটি সমাধান খুঁজুন: α= -1, β = 1, α ̸= β যেহেতু গেমটিতে একটি স্যাডল পয়েন্ট নেই। আমরা মিশ্র কৌশলে সমাধান খুঁজছি। p∗ এবং q∗ এর সূত্র ব্যবহার করে, আমরা পাই p∗1 = p∗2 = 0.5 এবং q1∗ = q2∗ = 0.5, ν = 0 এভাবে, SA∗ = (0.5, 0.5) SB∗ = (0.5, 0.5) ) উদাহরণ 4 ম্যাট্রিক্স দিয়ে গেমের একটি সমাধান খুঁজুন () 2 5 A = 6 4 সমাধান: গেমটিতে একটি স্যাডল পয়েন্ট নেই, যেহেতু α= 4, β = 5, α ̸= β। আমরা মিশ্র কৌশলে সমাধান খুঁজছি। p∗ এবং q∗ এর সূত্র ব্যবহার করে, আমরা p∗1 = 0.4, p∗2 = 0.6 এবং q1∗ = 0.2 q2∗ = 0.8, ν = 4.4 এইভাবে, SA∗ = (0.4, 0.6) SB∗ = (0.4, 0.6) 0.2, 0.8) 11 3.1.2। জ্যামিতিক ব্যাখ্যা 2 × 2 গেমটিকে একটি সহজ জ্যামিতিক ব্যাখ্যা দেওয়া যেতে পারে। আসুন আমরা অ্যাবসিসা অক্ষের একটি একক অংশ গ্রহণ করি, যার প্রতিটি বিন্দু আমরা কিছু মিশ্র কৌশল S = (p1, p2) = (p1, 1 − p1) এর সাথে যুক্ত করি এবং কৌশল A1 এর সম্ভাব্যতা p1 থেকে দূরত্বের সমান হবে বিভাগের ডান প্রান্তে SA নির্দেশ করুন, এবং সম্ভাব্যতা p2 , কৌশল A2 - বাম প্রান্তের দূরত্ব। .y .I .I I .B1′ .N .B1 .a21 .a11 .I I .I .∗ .x .P2 .SA∗ .P1∗ বিশেষ করে, বিভাগটির বাম প্রান্তটি (অ্যাবসিসা = 0 সহ বিন্দু) অনুরূপ কৌশল A1-এ, সেগমেন্টের ডান প্রান্তে (x = 1) - কৌশল A2 সেগমেন্টের শেষে, x-অক্ষের দুটি লম্ব পুনরুদ্ধার করা হয়েছে: অক্ষ I − I - কৌশল A1-এর জন্য পেঅফ স্থগিত করা হয়েছে; অক্ষ II − II - কৌশল A2 এর জন্য অর্থ প্রদান স্থগিত করা হয়েছে। খেলোয়াড় B কে কৌশল B1 প্রয়োগ করতে দিন; এটি অক্ষ I − I এবং II − II, যথাক্রমে, a11 এবং a21 অর্ডিনেট সহ বিন্দু দেয়। আমরা এই বিন্দুগুলির মাধ্যমে একটি সরল রেখা B1 − B1′ আঁকি। যেকোন মিশ্র কৌশল SA = (p1, p2), প্লেয়ারের পেঅফ নির্ণয় করা হয় বিন্দু N দ্বারা সরলরেখা B1 − B1′, x-অক্ষের বিন্দু SA-এর অনুপাতে p2: p1 অনুপাতে সেগমেন্টকে ভাগ করে। স্পষ্টতই, সরলরেখা B2 − B2′, যা কৌশল B2-এর জন্য অর্থপ্রদান নির্ধারণ করে, ঠিক একইভাবে তৈরি করা যেতে পারে। 12 .y .I .I I .B2 .N .a21 .B2′ a . 22 .I I .I .∗ .x .P2 .SA∗ .P1∗ সর্বোত্তম কৌশল SA∗ খুঁজে বের করা প্রয়োজন, যেমন যাতে প্লেয়ার A-এর সর্বনিম্ন পারিশ্রমিক (খেলোয়াড় B দ্বারা তার জন্য সবচেয়ে খারাপ আচরণ দেওয়া) সর্বোচ্চে পরিণত হবে। এটি করার জন্য, B1, B2, অর্থাৎ কৌশলগুলির জন্য প্লেয়ার A-এর পে অফের জন্য একটি নিম্ন সীমানা তৈরি করুন। ভাঙা লাইন B1 N B2′; এই সীমানায় প্লেয়ার A-এর যেকোন মিশ্র কৌশলের জন্য সর্বনিম্ন পেঅফ থাকবে, পয়েন্ট N, যেখানে এই পেঅফ সর্বাধিক পৌঁছায় এবং খেলার সিদ্ধান্ত এবং মূল্য নির্ধারণ করে। .y .I .I I .B2 .B1′ .N .B1 .B2′ .I I .I .∗ .x .P2 A∗ S 1∗ P বিন্দু N এর অর্ডিনেট খেলার খরচের চেয়ে বেশি কিছু নয়, এর অ্যাবসিসা ∗2 এর সমান, এবং সেগমেন্টের ডান প্রান্তের দূরত্ব ∗1 এর সমান, অর্থাৎ SA∗ বিন্দু থেকে সেগমেন্টের প্রান্তের দূরত্ব খেলোয়াড় A-এর সর্বোত্তম মিশ্র কৌশলের A2 এবং A1 কৌশলগুলির ∗2 এবং ∗1 সম্ভাব্যতার সমান। এই ক্ষেত্রে, গেমের সমাধান দ্বারা নির্ধারিত হয়েছিল কৌশল B1 এবং B2 এর ছেদ বিন্দু। নীচে একটি কেস যেখানে প্লেয়ারের সর্বোত্তম কৌশল হল বিশুদ্ধ কৌশল A2। এখানে কৌশল A2 (যে কোনো শত্রু কৌশলের জন্য) কৌশল A1, 13 .y .y .I .I I .I I .I .B2′ এর চেয়ে বেশি লাভজনক। 1′ B .B1′ B . 2 .B2′ B। 2 .B1 .ν = a21 .B1 .ν = a21 I. I I. I .I .একাদশ . .এক্স. 2∗ পি। A∗S = A2। 2∗ পি। A∗ S = A2 ডানদিকে দেখানো হয় যখন প্লেয়ার B এর একটি স্পষ্টতই অলাভজনক কৌশল থাকে। জ্যামিতিক ব্যাখ্যাটি গেমটির নিম্ন মূল্য α এবং উপরের দাম β .y .I .I I .B2 কে কল্পনা করাও সম্ভব করে তোলে .B1′ .N .B1 . B2′ .β = a21 .α = a22 .I I .I .∗ .x .P2 । A∗ S 1∗ P একই গ্রাফে, আমরা প্লেয়ার B-এর সর্বোত্তম কৌশলগুলির একটি জ্যামিতিক ব্যাখ্যাও দিতে পারি। এটা যাচাই করা সহজ যে সর্বোত্তম মিশ্র কৌশল SB∗ = (q1∗ , q2∗) এর কৌশল B1 এর ভাগ q1∗ এবং KB1 সেগমেন্টের দৈর্ঘ্যের যোগফল KB2 এর দৈর্ঘ্যের অনুপাতের সমান। এবং I − I অক্ষের উপর KB2: .y .I .I I .B2 . B1′ .N .K .L .B1 .B2′ .I I .I .∗ .x .P2 । A∗ S 1∗ P 14 KB2 q1∗ = KB2 + KB1 বা LB2′ q1∗ = LB2′ + LB1′ সর্বোত্তম কৌশলটি SB∗ = (q1∗ , q2∗) অন্যভাবে পাওয়া যেতে পারে, যদি আমরা B এবং B খেলোয়াড়দের অদলবদল করি, এবং জয়ের সর্বনিম্ন সীমার পরিবর্তে সর্বোচ্চ সর্বোচ্চ সীমা বিবেচনা করুন। .y .I .I I .A2 .A′1 .N .A1 .A′2 .I I .I . .x .q2∗। B∗ S .q1∗ 15 3.2। 2 × n এবং m × 2 গেম 2 × n এবং m × 2 গেমগুলির সমাধান নিম্নলিখিত উপপাদ্যের উপর ভিত্তি করে। উপপাদ্য 3. যেকোন সীমিত খেলা m × n এর একটি সমাধান থাকে যেখানে প্রতিটি পক্ষের সক্রিয় কৌশলের সংখ্যা m এবং n সংখ্যার ক্ষুদ্রতম সীমা অতিক্রম করে না। এই উপপাদ্য অনুসারে, একটি 2 × n গেমের সর্বদা একটি সমাধান থাকে যেখানে প্রতিটি খেলোয়াড়ের সর্বাধিক দুটি সক্রিয় কৌশল থাকে। একবার আপনি এই কৌশলগুলি খুঁজে পেলে, 2 × n গেমটি 2 × 2 গেমে পরিণত হবে, যা প্রাথমিক উপায়ে সমাধান করা যেতে পারে। সক্রিয় কৌশলগুলি সন্ধান করা গ্রাফিকভাবে করা যেতে পারে: 1) একটি গ্রাফিকাল ব্যাখ্যা তৈরি করা হয়; 2) জয়ের নিম্ন সীমা নির্ধারণ করা হয়; 3) দ্বিতীয় প্লেয়ারের দুটি কৌশল পেঅফের নিম্ন সীমাতে চিহ্নিত করা হয়, যা সর্বাধিক অর্ডিনেটের সাথে বিন্দুতে ছেদ করা দুটি লাইনের সাথে মিলে যায় (যদি দুটি লাইন এই বিন্দুতে ছেদ করে তবে যেকোন জোড়া নেওয়া হয়) - এই কৌশলগুলি প্লেয়ার B এর সক্রিয় কৌশলগুলি উপস্থাপন করে। এভাবে, গেম 2 × n গেমটি 2 × 2 এ কমে যায়। গেম m × 2ও সমাধান করা যেতে পারে, এই পার্থক্যটি নিম্ন নয়, তবে পরিশোধের উপরের সীমা নির্মিত, এবং সর্বোচ্চ নয়, কিন্তু সর্বনিম্ন এটি চাওয়া হয়. উদাহরণ 5 গেমের একটি সমাধান খুঁজুন () 7 9 8 A = 10 6 9 সমাধান: জ্যামিতিক পদ্ধতি ব্যবহার করে, আমরা সক্রিয় কৌশল নির্বাচন করি। সরাসরি লাইন B1 − B1′, B2 − B2′ এবং B3 − B3′ কৌশলগুলি B1, B2, B3 এর সাথে মিলে যায়। ভাঙা লাইন B1 N B2 হল খেলোয়াড়ের জয়ের নিম্ন সীমা। গেমটির একটি সমাধান রয়েছে S∗A = (23, 31); S∗B = (0.5; 0.5; 0); v = 8. 16 .y .I .I I . 1′ B B 2 .B3′ .N .B3 .B1 .B2′ .I I .I . .এক্স. 2∗ পি। A∗ S 1∗ P 17 ইনডেক্স গেম, 2 মুভ, 3 2 × 2, 10 ব্যক্তিগত, 3 2 × 2, 9 র্যান্ডম, 3 জ্যামিতি, 12 নেট গেমের মূল্য, 7টি উদাহরণ, 10 2 × n, 9, 16 m × 2, 9 , 16 অসীম, 4 স্বাভাবিক আকারে, 5 সসীম, 4 মাল্টি-মুভ, 4 এক-চাল, 4 ম্যাট্রিক্স, 5 জোড়া, 2 শূন্য-সমষ্টি, 2 বিরোধী, 2 অ-বিরোধী, 2 সমাধান, 5 মিশ্র কৌশলে, 5 , বিশুদ্ধ কৌশলে 9, স্যাডল পয়েন্ট সহ 5, 7 মূল্য, 5 উপরের, 6 নিম্ন, 6 বিশুদ্ধ, 7 ম্যাক্সিমিন, 6 গেম ম্যাট্রিক্স, 5 পেঅফ, 5 মিনিম্যাক্স, 6 গেম স্বাভাবিককরণ, 5 কৌশল, 4 ম্যাক্সিমিন, 6 মিনিম্যাক্স, 6 সর্বোত্তম, 4 মিশ্র, 5 গেম তত্ত্ব, 2 18

জনপ্রিয় আমেরিকান ব্লগ ক্র্যাকড থেকে।

গেম থিওরি হল সর্বোত্তম পদক্ষেপ নেওয়ার উপায়গুলি অধ্যয়ন করা এবং ফলস্বরূপ, অন্যান্য খেলোয়াড়দের কাছ থেকে কিছু কেটে ফেলার মাধ্যমে যতটা সম্ভব বিজয়ী পাই পান। এটি আপনাকে অনেকগুলি কারণ বিশ্লেষণ করতে এবং যৌক্তিকভাবে ভারসাম্যপূর্ণ সিদ্ধান্ত নিতে শেখায়। আমি মনে করি এটি সংখ্যার পরে এবং বর্ণমালার আগে অধ্যয়ন করা উচিত। শুধু কারণ অনেক মানুষ অন্তর্দৃষ্টি, গোপন ভবিষ্যদ্বাণী, তারার অবস্থান এবং এর মতো গুরুত্বপূর্ণ সিদ্ধান্ত নেয়। আমি পুঙ্খানুপুঙ্খভাবে গেম তত্ত্ব অধ্যয়ন করেছি, এবং এখন আমি আপনাকে এর মূল বিষয়গুলি সম্পর্কে বলতে চাই। সম্ভবত এটি আপনার জীবনে কিছু সাধারণ জ্ঞান যোগ করবে।

1. বন্দীর দ্বিধা

বার্তো এবং রবার্টকে পালানোর জন্য একটি চুরি করা গাড়ি সঠিকভাবে ব্যবহার করতে ব্যর্থ হওয়ার পরে ব্যাঙ্ক ডাকাতির জন্য গ্রেপ্তার করা হয়েছিল। পুলিশ প্রমাণ করতে পারে না যে তারাই ব্যাঙ্ক ডাকাতি করেছিল, কিন্তু তারা একটি চুরি করা গাড়িতে তাদের হাতেনাতে ধরেছিল। তাদের বিভিন্ন কক্ষে নিয়ে যাওয়া হয়েছিল এবং প্রত্যেককে একটি চুক্তির প্রস্তাব দেওয়া হয়েছিল: একজন সহযোগীকে হস্তান্তর করতে এবং তাকে 10 বছরের জন্য কারাগারে পাঠাতে এবং নিজেকে মুক্তি দিতে। কিন্তু যদি তারা উভয়েই একে অপরের সাথে বিশ্বাসঘাতকতা করে, তবে প্রত্যেকে 7 বছর পাবে। যদি কেউ কিছু না বলে, তাহলে দুজনেই গাড়ি চুরির দায়ে ২ বছরের জন্য জেলে যাবে।

দেখা যাচ্ছে যে যদি বার্তো চুপ থাকে, কিন্তু রবার্ট তাকে ফিরিয়ে দেয়, বার্তো 10 বছরের জন্য জেলে যায় এবং রবার্ট মুক্ত হয়।

প্রতিটি বন্দী একজন খেলোয়াড়, এবং প্রত্যেকের সুবিধা একটি "সূত্র" হিসাবে প্রকাশ করা যেতে পারে (তারা উভয়েই কী পায়, অন্যরা কী পায়)। উদাহরণস্বরূপ, যদি আমি আপনাকে আঘাত করি, আমার বিজয়ী প্যাটার্নটি এরকম দেখাবে (আমি একটি অভদ্র জয় পেয়েছি, আপনি এতে ভোগেন তীব্র ব্যথা) যেহেতু প্রতিটি বন্দীর দুটি বিকল্প রয়েছে, তাই আমরা একটি টেবিলে ফলাফল উপস্থাপন করতে পারি।

ব্যবহারিক প্রয়োগ: Sociopaths সনাক্তকরণ

এখানে আমরা গেম তত্ত্বের মূল প্রয়োগ দেখতে পাচ্ছি: সোসিওপ্যাথদের চিহ্নিত করা যারা শুধুমাত্র নিজেদের সম্পর্কে চিন্তা করে।ট্রু গেম থিওরি হল একটি শক্তিশালী বিশ্লেষণী হাতিয়ার, এবং অপেশাদার প্রায়শই একটি লাল পতাকা হিসাবে কাজ করে যা এমন কাউকে পতাকা দেয় যার কোন সম্মান নেই। যারা স্বজ্ঞাত গণনা করে তারা বিশ্বাস করে যে কুৎসিত কিছু করা আরও ভাল কারণ এটি অন্য খেলোয়াড় যাই করুক না কেন এর ফলে একটি ছোট জেলের শাস্তি হবে। টেকনিক্যালি এটি সঠিক, কিন্তু শুধুমাত্র যদি আপনি একজন অদূরদর্শী ব্যক্তি হন যে সংখ্যাটি বেশি রাখে মানুষের জীবন. এই কারণেই গেম থিওরি ফিনান্সে এত জনপ্রিয়।

বন্দীর দ্বিধা নিয়ে আসল সমস্যা হল এটি ডেটা উপেক্ষা করে।উদাহরণস্বরূপ, আপনি 10 বছরের জন্য কারাগারে পাঠানো ব্যক্তির বন্ধু, আত্মীয় বা এমনকি ঋণদাতাদের সাথে আপনার সাক্ষাতের সম্ভাবনা বিবেচনা করে না।

সবচেয়ে খারাপ দিক হল যে বন্দীর দ্বন্দ্বের সাথে জড়িত প্রত্যেকে এমনভাবে কাজ করে যেন তারা কখনও শুনেনি।

এবং সর্বোত্তম পদক্ষেপ হল নীরব থাকা, এবং দুই বছর পরে, একটি ভাল বন্ধুর সাথে একই অর্থ ব্যবহার করুন।

2. প্রভাবশালী কৌশল

এটি এমন একটি পরিস্থিতি যেখানে আপনার কর্মগুলি দেয় সবচেয়ে বড় জয়, প্রতিপক্ষের কর্ম নির্বিশেষে.যাই ঘটুক না কেন, আপনি সবকিছু ঠিকঠাক করেছেন। এই কারণেই প্রিজনারস ডিলেমা সহ অনেক লোক বিশ্বাস করে যে বিশ্বাসঘাতকতা অন্য ব্যক্তি যাই করুক না কেন "সর্বোত্তম" ফলাফলের দিকে নিয়ে যায় এবং এই পদ্ধতিতে অন্তর্নিহিত বাস্তবতার অজ্ঞতা এটিকে খুব সহজ দেখায়।

আমরা যে গেমগুলি খেলি তার বেশিরভাগেরই কঠোরভাবে প্রভাবশালী কৌশল নেই কারণ অন্যথায় সেগুলি ভয়ানক হবে। আপনি যদি সবসময় একই জিনিস করেন তাহলে কল্পনা করুন। রক-কাগজ-কাঁচির খেলায় কোনো প্রভাবশালী কৌশল নেই। তবে আপনি যদি এমন একজন ব্যক্তির সাথে খেলতেন যার চুলায় চুলা ছিল এবং সে কেবল শিলা বা কাগজ দেখাতে পারে তবে আপনার একটি প্রভাবশালী কৌশল থাকবে: কাগজ। আপনার কাগজ তার পাথর মোড়ানো হবে বা একটি ড্র ফলাফল, এবং আপনি হারাতে পারবেন না কারণ আপনার প্রতিপক্ষ কাঁচি দেখাতে পারে না। এখন যেহেতু আপনার একটি প্রভাবশালী কৌশল আছে, আপনি ভিন্ন কিছু চেষ্টা করার জন্য বোকা হবেন।

3. লিঙ্গের যুদ্ধ

গেমগুলি আরও আকর্ষণীয় হয় যখন তাদের একটি কঠোরভাবে প্রভাবশালী কৌশল থাকে না। যেমন লিঙ্গের যুদ্ধ। অঞ্জলি এবং বরিসলাভ ডেটে যায়, কিন্তু ব্যালে এবং বক্সিং এর মধ্যে বেছে নিতে পারে না। অঞ্জলি বক্সিং পছন্দ করেন কারণ তিনি দর্শকদের চিৎকারের ভিড়ের আনন্দে রক্ত ​​প্রবাহ দেখতে উপভোগ করেন যারা মনে করেন যে তারা সভ্য এই কারণে যে তারা কারও মাথা ভেঙে দেওয়ার জন্য অর্থ প্রদান করেছে।

বরিসলাভ ব্যালে দেখতে চায় কারণ সে বোঝে যে ব্যালেরিনারা কিসের মধ্য দিয়ে যায় অনেক পরিমাণআঘাত এবং সবচেয়ে কঠিন প্রশিক্ষণ, এটা জেনে যে একটি আঘাত সবকিছু শেষ করতে পারে। ব্যালে নৃত্যশিল্পী - সর্বশ্রেষ্ঠ ক্রীড়াবিদমাটিতে. একটি ব্যালেরিনা আপনাকে মাথায় লাথি মারতে পারে, তবে সে কখনই তা করবে না, কারণ তার পা আপনার মুখের চেয়ে অনেক বেশি মূল্যবান।

তাদের প্রত্যেকে তাদের প্রিয় ইভেন্টে যেতে চায়, কিন্তু তারা একা এটি উপভোগ করতে চায় না, তাই তারা কীভাবে জিতবে তা এখানে: সর্বোচ্চ মান- তারা যা পছন্দ করে তাই করুন, ক্ষুদ্রতম মান- শুধু অন্য ব্যক্তির সাথে থাকা, এবং শূন্য - একা থাকা।

কিছু লোক একগুঁয়ে ব্রঙ্কসম্যানশিপের পরামর্শ দেয়: আপনি যদি যা চান তা করেন না কেন, অন্য ব্যক্তিকে অবশ্যই আপনার পছন্দ মেনে চলতে হবে বা সবকিছু হারাতে হবে। আমি আগেই বলেছি, সরলীকৃত খেলা তত্ত্ব বোকা শনাক্ত করতে মহান.

ব্যবহারিক প্রয়োগ: তীক্ষ্ণ কোণ এড়িয়ে চলুন

অবশ্যই, এই কৌশলটিরও তার উল্লেখযোগ্য ত্রুটি রয়েছে। প্রথমত, আপনি যদি আপনার ডেটিংকে "লিঙ্গের যুদ্ধ" হিসাবে বিবেচনা করেন তবে এটি কাজ করবে না। ব্রেক আপ করুন যাতে আপনি প্রত্যেকে তাদের পছন্দের কাউকে খুঁজে পেতে পারেন। এবং দ্বিতীয় সমস্যা হল এই পরিস্থিতিতে অংশগ্রহণকারীরা নিজেদের সম্পর্কে এতটাই অনিশ্চিত যে তারা এটি করতে পারে না।

প্রত্যেকের জন্য সত্যিকারের বিজয়ী কৌশল হল তারা যা চায় তা করা।এবং পরে, বা পরের দিন, যখন তারা ফ্রি থাকে, একসাথে একটি ক্যাফেতে যান। বা বক্সিং এবং ব্যালে মধ্যে বিকল্প যতক্ষণ না বিনোদন জগতে একটি বিপ্লব ঘটে এবং বক্সিং ব্যালে উদ্ভাবিত হয়।

4. ন্যাশ ভারসাম্য

একটি ন্যাশ ভারসাম্য হল এমন একটি পদক্ষেপের সেট যেখানে কেউ সত্যের পরে ভিন্নভাবে কিছু করতে চায় না।এবং যদি আমরা এটিকে কার্যকর করতে পারি, গেম থিওরি গ্রহের সমগ্র দার্শনিক, ধর্মীয় এবং আর্থিক ব্যবস্থাকে প্রতিস্থাপন করবে, কারণ "ভাঙ্গা যাবে না" মানবতার জন্য আরও শক্তিশালী হয়ে উঠেছে। চালিকা শক্তিআগুনের চেয়ে

আসুন দ্রুত $100 ভাগ করি। আপনি এবং আমি স্থির করি যে আমাদের কত শত শত প্রয়োজন এবং একই সাথে পরিমাণ ঘোষণা করি। যদি আমাদের সর্বমোট পরিমাণএকশোরও কম, সবাই যা চেয়েছিল তাই পায়। যদি মোটএকশোরও বেশি, যে সর্বনিম্ন পরিমাণ চেয়েছিল সে পছন্দসই পরিমাণ পায়, এবং লোভী ব্যক্তি যা অবশিষ্ট থাকে তা পায়। যদি আমরা একই পরিমাণের জন্য জিজ্ঞাসা করি, প্রত্যেকে $50 পাবে। আপনি কত জিজ্ঞাসা করবেন? আপনি কিভাবে টাকা ভাগ করবেন? শুধুমাত্র একটি বিজয়ী পদক্ষেপ আছে.

$51 দাবি করলে আপনি পাবেন সর্বোচ্চ পরিমাণআপনার প্রতিপক্ষ যা পছন্দ করুক না কেন। যদি তিনি আরও কিছু চান, আপনি $51 পাবেন। যদি সে $50 বা $51 চায়, আপনি $50 পাবেন। এবং যদি সে $50 এর কম চায়, আপনি $51 পাবেন। যেভাবেই হোক, অন্য কোন বিকল্প নেই যা আপনাকে এর চেয়ে বেশি অর্থ উপার্জন করবে। ন্যাশ ভারসাম্য - এমন একটি পরিস্থিতি যেখানে আমরা উভয়েই $51 পছন্দ করি।

ব্যবহারিক প্রয়োগ: প্রথমে চিন্তা করুন

এটি গেম থিওরির পুরো পয়েন্ট। আপনাকে জিততে হবে না, অন্য খেলোয়াড়দের অনেক কম ক্ষতি করতে হবে, তবে আপনার আশেপাশের লোকেরা আপনার জন্য যা সঞ্চয় করে থাকুক না কেন আপনাকে নিজের জন্য সেরা পদক্ষেপ নিতে হবে। এবং এটি আরও ভাল যদি এই পদক্ষেপটি অন্য খেলোয়াড়দের জন্য উপকারী হয়। এটি এমন গণিত যা সমাজকে পরিবর্তন করতে পারে।

এই ধারণার একটি আকর্ষণীয় পরিবর্তন হল মদ্যপান, যাকে সময়-নির্ভর ন্যাশ ইকুইলিব্রিয়াম বলা যেতে পারে। আপনি যখন পর্যাপ্ত পান করেন, তখন আপনি অন্য লোকেদের ক্রিয়াকলাপ সম্পর্কে চিন্তা করেন না তারা যাই করুক না কেন, কিন্তু পরের দিন আপনি ভিন্নভাবে কিছু না করতে পেরে দুঃখিত হন।

5. টস খেলা

প্লেয়ার 1 এবং প্লেয়ার 2 এর মধ্যে টস খেলা হয়। প্রতিটি প্লেয়ার একই সাথে হেড বা লেজ বেছে নেয়। যদি তারা সঠিকভাবে অনুমান করে, প্লেয়ার 1 প্লেয়ার 2 এর পেনি পায়৷ যদি না হয়, প্লেয়ার 2 প্লেয়ার 1 এর মুদ্রা পায়৷

বিজয়ী ম্যাট্রিক্স সহজ...

... সর্বোত্তম কৌশল: এলোমেলোভাবে সম্পূর্ণভাবে খেলুন।এটি আপনার চিন্তার চেয়ে কঠিন কারণ পছন্দটি সম্পূর্ণ র্যান্ডম হতে হবে। আপনার যদি মাথা বা লেজের পছন্দ থাকে, তাহলে আপনার প্রতিপক্ষ আপনার টাকা নেওয়ার জন্য এটি ব্যবহার করতে পারে।

অবশ্যই, এখানে আসল সমস্যাটি হ'ল তারা একে অপরের দিকে এক পয়সা নিক্ষেপ করলে এটি আরও ভাল হবে। ফলস্বরূপ, তাদের লাভ একই হবে, এবং ফলস্বরূপ ট্রমা এই হতভাগ্য ব্যক্তিদের ভয়ানক একঘেয়েমি ছাড়া অন্য কিছু অনুভব করতে সহায়তা করতে পারে। সব পরে, এই সবচেয়ে খারাপ খেলাকখনও বিদ্যমান। আর এই পেনাল্টি শুটআউটের আদর্শ মডেল।

ব্যবহারিক প্রয়োগ: শাস্তি

ফুটবল, হকি এবং অন্যান্য অনেক খেলায় অতিরিক্ত সময় পেনাল্টি শুটআউট। এবং তারা আরো আকর্ষণীয় হবে যদি তারা কতবার খেলোয়াড়দের উপর ভিত্তি করে সম্পূর্ণ ফর্মএকটি কার্টহুইল করতে সক্ষম হবে কারণ এটি অন্তত তাদের শারীরিক ক্ষমতার একটি ইঙ্গিত হবে এবং দেখতে মজা হবে। গোলরক্ষকরা তার চলাচলের একেবারে শুরুতে একটি বল বা পাকের গতিবিধি স্পষ্টভাবে নির্ধারণ করতে পারে না, কারণ, দুর্ভাগ্যবশত, রোবটরা এখনও আমাদের ক্রীড়া প্রতিযোগিতায় অংশগ্রহণ করে না। গোলরক্ষককে অবশ্যই বাম বা ডান দিক বেছে নিতে হবে এবং আশা করি তার পছন্দটি প্রতিপক্ষের পছন্দের সাথে মিলে যায় যেটি গোলে গুলি করছে। কয়েন খেলার সাথে এর কিছু মিল আছে।

যাইহোক, মনে রাখবেন যে এটি মাথা এবং লেজের খেলার সাদৃশ্যের একটি নিখুঁত উদাহরণ নয়, কারণ এমনকি যদি সঠিক পছন্দ করাদিকনির্দেশনা, গোলরক্ষক বল ধরতে নাও পারে, এবং আক্রমণকারী গোলে আঘাত করতে পারে না।

তাহলে গেম থিওরি অনুযায়ী আমাদের উপসংহার কি? বল গেমগুলি একটি "মাল্টি-বল" পদ্ধতিতে শেষ হওয়া উচিত, যেখানে প্রতি মিনিটে এক-একজন খেলোয়াড়কে একটি অতিরিক্ত বল/পাক দেওয়া হয় যতক্ষণ না এক পক্ষ একটি নির্দিষ্ট ফলাফল অর্জন করে, যা খেলোয়াড়দের প্রকৃত দক্ষতার ইঙ্গিত দেয় এবং একটি দর্শনীয় এলোমেলো কাকতালীয় নয়।

দিনের শেষে, গেমটিকে আরও স্মার্ট করতে গেম থিওরি ব্যবহার করা উচিত। যার মানে এটা ভালো।

খেলা তত্ত্বঅপারেশন গবেষণার একটি শাখা হিসাবে, এটি বিভিন্ন স্বার্থের সাথে বিভিন্ন পক্ষের অনিশ্চয়তা বা দ্বন্দ্বের পরিস্থিতিতে সর্বোত্তম সিদ্ধান্ত নেওয়ার জন্য গাণিতিক মডেলের তত্ত্ব। গেম তত্ত্ব গেমিং পরিস্থিতিতে সর্বোত্তম কৌশল অধ্যয়ন করে। এর মধ্যে রয়েছে বৈজ্ঞানিক ও অর্থনৈতিক পরীক্ষা-নিরীক্ষার ব্যবস্থার জন্য সবচেয়ে লাভজনক উৎপাদন সমাধানের পছন্দ সংক্রান্ত পরিস্থিতি, সংস্থা পরিসংখ্যান নিয়ন্ত্রণ, শিল্প উদ্যোগ এবং অন্যান্য সেক্টর মধ্যে অর্থনৈতিক সম্পর্ক. আনুষ্ঠানিকতা সংঘর্ষের পরিস্থিতিগাণিতিকভাবে, এগুলিকে দুই, তিন, ইত্যাদির খেলা হিসাবে উপস্থাপন করা যেতে পারে। খেলোয়াড়, যাদের প্রত্যেকে তাদের সুবিধা সর্বাধিক করার লক্ষ্য অনুসরণ করে, অন্যের খরচে তাদের জয়।

"গেম থিওরি" বিভাগটি তিনটি দ্বারা প্রতিনিধিত্ব করা হয় অনলাইন ক্যালকুলেটর:

  1. খেলোয়াড়দের সর্বোত্তম কৌশল। এই ধরনের সমস্যায়, একটি পেমেন্ট ম্যাট্রিক্স নির্দিষ্ট করা হয়। খেলোয়াড়দের বিশুদ্ধ বা মিশ্র কৌশল খুঁজে বের করতে হবে এবং, খেলা মূল্য. সমাধান করতে, আপনাকে অবশ্যই ম্যাট্রিক্সের মাত্রা এবং সমাধান পদ্ধতি উল্লেখ করতে হবে। সেবা বাস্তবায়ন করে নিম্নলিখিত পদ্ধতিএকটি দুই-প্লেয়ার গেমের সমাধান:
    1. মিনিম্যাক্স। আপনি যদি খেলোয়াড়দের বিশুদ্ধ কৌশল খুঁজে পেতে বা একটি গেমের স্যাডল পয়েন্ট সম্পর্কে একটি প্রশ্নের উত্তর দিতে চান তবে এই সমাধান পদ্ধতিটি বেছে নিন।
    2. সিমপ্লেক্স পদ্ধতি। লিনিয়ার প্রোগ্রামিং পদ্ধতি ব্যবহার করে মিশ্র কৌশল গেমগুলি সমাধান করতে ব্যবহৃত হয়।
    3. গ্রাফিক পদ্ধতি। মিশ্র কৌশল গেম সমাধান করতে ব্যবহৃত. একটি স্যাডল পয়েন্ট থাকলে, সমাধান বন্ধ হয়ে যায়। উদাহরণ: একটি প্রদত্ত অর্থপ্রদান ম্যাট্রিক্সের জন্য, খেলোয়াড়দের সর্বোত্তম মিশ্র কৌশল এবং গেমের মূল্য ব্যবহার করে খুঁজুন গ্রাফিক পদ্ধতিখেলা সমাধান।
    4. ব্রাউন-রবিনসন পুনরাবৃত্তি পদ্ধতি। পুনরাবৃত্তিমূলক পদ্ধতি ব্যবহার করা হয় যখন গ্রাফিক্যাল পদ্ধতি প্রযোজ্য নয় এবং যখন বীজগণিত এবং ম্যাট্রিক্স পদ্ধতি. এই পদ্ধতিটি গেমের মূল্যের একটি আনুমানিক মান দেয় এবং সঠিক মানটি যেকোন পছন্দসই মাত্রার সাথে পাওয়া যেতে পারে। এই পদ্ধতিটি সর্বোত্তম কৌশল খোঁজার জন্য যথেষ্ট নয়, তবে এটি আপনাকে একটি টার্ন-ভিত্তিক গেমের গতিশীলতা ট্র্যাক করতে এবং প্রতিটি ধাপে প্রতিটি খেলোয়াড়ের জন্য গেমের খরচ নির্ধারণ করতে দেয়।
    উদাহরণস্বরূপ, কাজটি "পে-অফ ম্যাট্রিক্স দ্বারা প্রদত্ত গেমের জন্য খেলোয়াড়দের সর্বোত্তম কৌশলগুলি নির্দেশ করুন" এর মতো শোনাতে পারে.
    সমস্ত পদ্ধতি প্রভাবশালী সারি এবং কলামগুলির জন্য একটি চেক ব্যবহার করে।
  2. বিম্যাট্রিক্স খেলা। সাধারণত এই ধরনের খেলায় প্রথম এবং দ্বিতীয় খেলোয়াড়দের বেতনের একই আকারের দুটি ম্যাট্রিস নির্দিষ্ট করা হয়। এই ম্যাট্রিক্সের সারিগুলি প্রথম খেলোয়াড়ের কৌশলগুলির সাথে মিলে যায় এবং ম্যাট্রিকের কলামগুলি দ্বিতীয় খেলোয়াড়ের কৌশলগুলির সাথে মিলে যায়। এই ক্ষেত্রে, প্রথম ম্যাট্রিক্স প্রথম খেলোয়াড়ের জয়ের প্রতিনিধিত্ব করে, এবং দ্বিতীয় ম্যাট্রিক্স দ্বিতীয়টির জয়ের প্রতিনিধিত্ব করে।
  3. প্রকৃতির সাথে খেলা। আপনি নির্বাচন করার প্রয়োজন হলে ব্যবহার করা হয় ব্যবস্থাপনা সিদ্ধান্ত Maximax, Bayes, Laplace, Wald, Savage, Hurwitz-এর মানদণ্ড অনুযায়ী।
    বেইস মাপদণ্ডের জন্য, ঘটনা ঘটানোর সম্ভাবনাগুলিও প্রবেশ করা প্রয়োজন। যদি সেগুলি নির্দিষ্ট করা না থাকে তবে ডিফল্ট মানগুলি ছেড়ে দিন (সমতুল ইভেন্ট থাকবে)।
    Hurwitz মানদণ্ডের জন্য, আশাবাদের মাত্রা নির্দেশ করুন λ। যদি এই প্যারামিটারটি শর্তগুলিতে নির্দিষ্ট করা না থাকে তবে আপনি 0, 0.5 এবং 1 মানগুলি ব্যবহার করতে পারেন।

কম্পিউটার ব্যবহার করে অনেক সমস্যার সমাধান খোঁজার প্রয়োজন হয়। উপরের পরিষেবা এবং ফাংশনগুলি অন্যতম সরঞ্জাম।



সাইটে নতুন

>

সবচেয়ে জনপ্রিয়