Rumah Kebersihan Penilaian ahli terhadap metode minimax dan metode Bayes-Laplace dan Savage. Lihat halaman yang menyebutkan istilah kriteria Bayes

Penilaian ahli terhadap metode minimax dan metode Bayes-Laplace dan Savage. Lihat halaman yang menyebutkan istilah kriteria Bayes

Latihan. Perusahaan berencana untuk menjual produknya di pasar, dengan mempertimbangkan kemungkinan pilihan permintaan konsumen P j , j = 1,4 (rendah, sedang, tinggi, sangat tinggi). Perusahaan telah mengembangkan tiga strategi penjualan barang A 1, A 2, A 3. Volume perputaran (unit uang), tergantung pada strategi dan permintaan konsumen, disajikan dalam tabel.
hal 1hal 2hal 3hal 4
Sebuah 130+N10 20 25 + T/2
Sebuah 250 70 - N10 + T/225
Sebuah 325 – T/235 40 60 - T/2
dimana N=3
Kemungkinan keadaan permintaan konsumen diketahui, yaitu masing-masing q 1 =0.3, q 2 =0.2, q 3 =0.4, q 4 =0.1. Penting untuk menemukan strategi penjualan yang memaksimalkan rata-rata omset perusahaan. Dalam hal ini, gunakan kriteria Wald, Hurwitz, Savage, dan Bayes.

Larutan temukan menggunakan kalkulator.
Kriteria Bayes.
Menurut kriteria Bayes, strategi (murni) A i yang memaksimalkan kemenangan rata-rata a atau risiko rata-rata r diminimalkan.
Kita hitung nilai ∑(a ij p j)
∑(a 1,j p j) = 33 0,3 + 10 0,2 + 20 0,4 + 26,5 0,1 = 22,55
∑(a 2,j p j) = 50 0,3 + 67 0,2 + 11,5 0,4 + 25 0,1 = 35,5
∑(a 3,j p j) = 23,5 0,3 + 35 0,2 + 40 0,4 + 58,5 0,1 = 35,9

dan sayahal 1hal 2hal 3hal 4∑(a ij pj)
Sebuah 1 9.9 2 8 2.65 22.55
Sebuah 2 15 13.4 4.6 2.5 35.5
Sebuah 3 7.05 7 16 5.85 35.9
hal j 0.3 0.2 0.4 0.1

Kriteria Laplace.
Jika probabilitas keadaan alamiah masuk akal, prinsip Laplace tentang alasan yang tidak mencukupi digunakan untuk menilainya, yang menurutnya semua keadaan alami diasumsikan memiliki kemungkinan yang sama, yaitu:
q 1 = q 2 = ... = q n = 1/n.
q saya = 1/4
dan sayahal 1hal 2hal 3hal 4∑(a ij)
Sebuah 1 8.25 2.5 5 6.63 22.38
Sebuah 2 12.5 16.75 2.88 6.25 38.38
Sebuah 3 5.88 8.75 10 14.63 39.25
hal j 0.25 0.25 0.25 0.25
Kesimpulan: pilih strategi N=3.
Kriteria Wald.
Menurut kriteria Wald, strategi murni dianggap optimal, yang dalam kondisi terburuk menjamin keuntungan maksimal, yaitu.
a = maks(min a ij)
Kriteria Wald memfokuskan statistik pada keadaan alam yang paling tidak menguntungkan, yaitu. kriteria ini mengungkapkan penilaian pesimistis terhadap situasi.
dan sayahal 1hal 2hal 3hal 4menit (a ij)
Sebuah 1 33 10 20 26.5 10
Sebuah 2 50 67 11.5 25 11.5
Sebuah 3 23.5 35 40 58.5 23.5
Kesimpulan: pilih strategi N=3.
Kriteria biadab.
Kriteria risiko minimum Savage merekomendasikan pemilihan strategi optimal dimana besarnya risiko maksimum diminimalkan dalam kondisi terburuk, yaitu asalkan:
a = min(maks r ij)
Kriteria Savage memfokuskan statistik pada keadaan alam yang paling tidak menguntungkan, yaitu. kriteria ini mengungkapkan penilaian pesimis terhadap situasi.
Kami menemukan matriks risiko.
Mempertaruhkan– ukuran kesenjangan antara berbagai kemungkinan hasil penerapan strategi tertentu. Penguatan maksimum pada kolom ke-j b j = max(a ij) mencirikan keadaan alam yang menguntungkan.
1. Hitung kolom pertama matriks risiko.
r 11 = 50 - 33 = 17; r 21 = 50 - 50 = 0; r 31 = 50 - 23,5 = 26,5;
2. Hitung kolom ke-2 matriks risiko.
r 12 = 67 - 10 = 57; r 22 = 67 - 67 = 0; r 32 = 67 - 35 = 32;
3. Hitung kolom ke-3 matriks risiko.
r 13 = 40 - 20 = 20; r 23 = 40 - 11,5 = 28,5; r 33 = 40 - 40 = 0;
4. Hitung kolom ke-4 matriks risiko.
r 14 = 58,5 - 26,5 = 32; r 24 = 58,5 - 25 = 33,5; r 34 = 58,5 - 58,5 = 0;
dan sayahal 1hal 2hal 3hal 4
Sebuah 1 17 57 20 32
Sebuah 2 0 0 28.5 33.5
Sebuah 3 26.5 32 0 0

dan sayahal 1hal 2hal 3hal 4maks(a ij)
Sebuah 1 17 57 20 32 57
Sebuah 2 0 0 28.5 33.5 33.5
Sebuah 3 26.5 32 0 0 32
Kesimpulan: pilih strategi N=3.
Kriteria Hurwitz.
Kriteria Hurwitz merupakan kriteria pesimisme – optimisme. Strategi optimal diambil dengan hubungan sebagai berikut:
maks (s i)
dimana s i = y min(a ij) + (1-y)maks(a ij)
Untuk y = 1 diperoleh kriteria Walde, untuk y = 0 diperoleh kriteria optimis (maksimum).
Kriteria Hurwitz memperhitungkan kemungkinan perilaku alam yang terburuk dan terbaik bagi manusia. Bagaimana kamu dipilih? Bagaimana konsekuensi yang lebih buruk keputusan yang salah, semakin besar keinginan untuk mengasuransikan kesalahan, semakin dekat y ke 1.
Kami menghitung s i.
s 1 = 0,5 10+(1-0,5) 33 = 21,5
s 2 = 0,5 11,5+(1-0,5) 67 = 39,25
s 3 = 0,5 23,5+(1-0,5) 58,5 = 41
dan sayahal 1hal 2hal 3hal 4menit (a ij)maks(a ij)y menit(a ij) + (1-y)maks(a ij)
Sebuah 1 33 10 20 26.5 10 33 21.5
Sebuah 2 50 67 11.5 25 11.5 67 39.25
Sebuah 3 23.5 35 40 58.5 23.5 58.5 41
Kesimpulan: pilih strategi N=3.
Jadi, sebagai akibat dari keputusan tersebut permainan statistik Berdasarkan berbagai kriteria, strategi A 3 lebih sering direkomendasikan dibandingkan strategi lainnya.

Manajemen perusahaan memutuskan untuk menempatkan produksi suatu produk baru di lokasi tertentu. Untuk membentuk gambaran tentang situasi pasar suatu produk baru pada saat penguasaan produksi, perlu memperhitungkan biaya pengiriman produk jadi ke konsumen, pengembangan transportasi dan infrastruktur sosial. wilayah, persaingan di pasar, hubungan antara penawaran dan permintaan, nilai tukar dan masih banyak lagi. Opsi yang memungkinkan keputusan yang daya tarik investasinya didefinisikan sebagai persentase pertumbuhan pendapatan sehubungan dengan jumlah penanaman modal, disajikan dalam tabel.
Memilih:
1) tempat produksi, jika pimpinan perusahaan yakin bahwa situasi 4 akan berkembang di pasar;
2) tempat untuk lokasi produksi jika manajemen memperkirakan probabilitas situasi 1 adalah 0,2; situasi 2 dalam 0,1; situasi 3 pada 0,25;
3) memilih suatu pilihan dalam kondisi ketidakpastian menurut kriteria: maximax, maximin, kriteria Laplace, kriteria Savage, kriteria Hurwitz (y = 0,3);
4) akankah itu berubah pilihan terbaik penyelesaian menurut kriteria Hurwitz jika nilai a dinaikkan menjadi 0,5?
5) dengan asumsi bahwa data tabel mewakili biaya perusahaan, tentukan pilihan yang akan diambil perusahaan ketika menggunakan masing-masing kriteria berikut: maksimal; maksimal; Kriteria Hurwitz(? = 0,3); Kriteria biadab; Kriteria Laplace

Diasumsikan bahwa simpanan tersebut tersebar merata di seluruh wilayah. Pendekatan ini hampir tidak dapat dianggap sah, karena kesimpulan yang diperoleh dengan bantuannya tidak memiliki dasar yang logis. Namun, kriteria Bayes-Laplace tidak lebih sewenang-wenang dibandingkan kriteria Hurwitz.


Pendekatan optimis, pendekatan berdasarkan kriteria Hurwitz, kriteria Bayes-Laplace dan kriteria Savage ada di dalamnya pada kasus ini tampilan berikutnya

Kriteria Bayesian (Laplace) 27, 224 Pendekatan Bayesian 27 Keseimbangan 27 Penyeimbangan (atau keseimbangan)

Di antara kriteria dan aturan tersebut, tempat khusus ditempati oleh aturan dan kriteria berdasarkan teorema Bayes yang terkenal. Pendekatan yang didasarkan pada teorema ini memungkinkan, pertama, untuk menggunakan beberapa prinsip metodologis ilmu alam dalam manajemen, dan kedua, untuk memastikan bahwa penilaian dan pengambilan keputusan disesuaikan seiring dengan bertambahnya pengalaman. Yang terakhir berarti belajar mengelola (dalam arti mengambil keputusan) dalam proses manajemen itu sendiri 1.

Terkadang selama operasi, ketidakpastian terungkap secara bertahap seiring dengan tersedianya informasi. Dalam hal ini, untuk membenarkan keputusan, akan lebih mudah untuk menggunakan kriteria objektif seperti probabilitas posterior suatu peristiwa. Probabilitas ini sendiri paling mudah dihitung menggunakan rumus Bayes dalam hal odds. Mari kita pertimbangkan inti dari pendekatan ini.

Kriteria Bayes digunakan ketika distribusi probabilitas keadaan yang mungkin diketahui. Jika distribusi probabilitas diskrit ini ditentukan oleh himpunan probabilitas , maka menurut kriteria Bayes, strategi Si lebih disukai daripada Sj (s > jika

Kasus khusus dari kriteria ini adalah kriteria Bayes (untuk A = 1) dan kriteria Wald (untuk A = 0).

Kriteria Bayes-Laplace, tidak seperti kriteria Wald, memperhitungkan setiap kemungkinan konsekuensi dari semua pilihan keputusan

Kriteria Bayes-Laplace menerapkan persyaratan berikut pada situasi di mana keputusan dibuat:

Ketika z = 1, kriteria tersebut diubah menjadi kriteria Bayes-Laplace, dan ketika z = O berubah menjadi kriteria Wald. Dengan demikian, pemilihan parameter z tunduk pada subjektivitas. Selain itu, jumlah penerapannya masih belum tertangani. Oleh karena itu, kriteria ini jarang digunakan ketika mengambil keputusan teknis.

Kami memeriksa beberapa pendekatan dasar pengambilan keputusan dalam kasus faktor-faktor yang tidak pasti dalam model yang diteliti. Anda dapat memberikan contoh ketika semua kriteria pengambilan keputusan mengarah pada pilihan solusi yang sama x e X, tetapi biasanya hal ini tidak terjadi, setiap kriteria mengarah pada keputusannya sendiri (contoh semacam ini akan dibahas pada bab berikutnya). Oleh karena itu, timbul diskusi tentang kriteria mana yang lebih disukai dan kapan. upaya dilakukan untuk membangun satu berdasarkan beberapa kriteria. Secara khusus, kriteria Hurwitz merupakan kombinasi dari dua kriteria. Upaya juga telah dilakukan untuk menggabungkan kriteria Hurvtz dan kriteria Bayes-Laplace. Semua kriteria yang dihasilkan memiliki tingkat kesewenang-wenangan yang tinggi. Menurut pendapat kami, satu-satunya cara untuk mengatasi kesulitan-kesulitan ini adalah pendekatan multi-kriteria, di mana pengambil keputusan dapat mempertimbangkan pilihan-pilihan pengambilan keputusan yang efektif dari sudut pandang serangkaian indikator, dan memilih yang paling sesuai. satu di antara mereka. Pendekatan ini digunakan dalam contoh yang diberikan pada bab berikutnya. Tentu saja totalitas indikatornya tidak boleh terlalu besar.

Biasanya, beberapa konfigurasi dicoba nomor yang berbeda elemen dan struktur koneksi. Salah satu yang paling banyak indikator penting adalah volume set pelatihan dan memastikan kemampuan untuk menggeneralisasi selama pekerjaan lebih lanjut, dan hasil yang diinginkan dapat dicapai berbagai skema. Prosedur yang paling umum digunakan adalah penurunan berurutan (dengan set konfirmasi) atau validasi silang N-fold. Kriteria informasi yang lebih kuat juga dapat diterapkan (1) validasi silang umum (GV), kesalahan prediksi Akaike akhir (FPE), kriteria Bayes (BI) dan kriteria Akaike (AI) (lihat ). Untuk meningkatkan kemampuan generalisasi dan menghilangkan bahaya overfitting, pengurangan dan eliminasi bobot (penipisan pohon) juga digunakan. Pada saat yang sama, arsitektur jaringan diubah, beberapa koneksi dihapus, dan pengaruhnya terhadap efisiensi dipelajari. >,

KRITERIA BAYES (LAPLACE) - dalam teori keputusan, kriteria untuk membuat keputusan tanpa adanya informasi tentang probabilitas relatif dari strategi “alam”. (Lihat Masalah yang tidak pasti.) Menurut B.(L.)k. Diusulkan untuk memberikan probabilitas yang sama terhadap semua strategi yang sedang dipertimbangkan, dan kemudian menerima strategi dengan ekspektasi hasil terbesar. Kerugiannya adalah kisaran alternatif yang dievaluasi dalam masalah yang sama bisa berbeda dan, oleh karena itu, probabilitas relatif dari masing-masing alternatif juga bisa berbeda.

Kriteria Hodges-Lehman. Saat menerapkan kriteria ini, dua indikator subjektif digunakan: pertama, distribusi probabilitas yang digunakan dalam kriteria Bayes, dan kedua, “parameter optimisme” dari kriteria Hurwitz.

Kriteria Hodge-Lehman didasarkan pada kriteria Wald dan Bayes-Laplace secara bersamaan

Saat mencari solusi optimal, mereka biasanya menggunakan berbagai kriteria, memberikan beberapa skema pengambilan keputusan. Mari kita lihat beberapa di antaranya.

Kriteria Bayes. Saat menggunakan kriteria Bayes, ahli statistik mengetahui probabilitas q k terjadinya peristiwa P k Biasanya, probabilitas q k ditentukan dengan melakukan eksperimen. Probabilitas seperti ini disebut posterior. Strategi murni diterima sebagai strategi optimal menurut kriteria Bayes dan saya, di mana statistik kemenangan rata-rata menjadi maksimum.

Kriteria Laplace. Kriteria Laplace berbeda dengan kriteria Bayes karena probabilitas posteriornya tidak diketahui. Kemudian disamakan dan dihitung menggunakan rumus

Kriteria biadab. Kriteria ini merupakan kriteria pesimisme ekstrim, yaitu. ahli statistik memulai dari asumsi bahwa alam bertindak melawannya dengan cara yang paling buruk. Kriteria Savage merekomendasikan untuk memilih strategi murni A i yang optimal dengan risiko maksimum minimal. Risiko ini disebut minimax dan dihitung dengan rumus

Kriteria Wald. Seperti kriteria Savage, kriteria Wald merupakan kriteria pesimisme ekstrim. Oleh karena itu, ahli statistik memilih strategi murni A sehingga hasil terkecil akan menjadi maksimal. Keuntungan ini disebut maximin dan dihitung dengan rumus

Kriteria Hurwitz. Kriteria ini merupakan kriteria pesimisme-optimisme dan menganjurkan penggunaan sesuatu di antaranya. Dalam hal ini, ahli statistik memilih strategi murni A i yang memenuhi kondisi berikut:

dimana γ = 0 1 dipilih dari pertimbangan subjektif. Ketika γ = 1, kriteria Hurwitz diubah menjadi kriteria Wald.

Contoh 4.6. Sebuah studio sedang dibuat untuk memperbaiki TV kondisi rawat inap. Untuk mempermudah, kita asumsikan aliran permintaan perbaikan dinyatakan dengan angka 2, 4, 6 dan 8 ribu permohonan per tahun. Berdasarkan pengalaman diketahui keuntungan memperbaiki satu TV adalah 9 ruang. unit di tahun. Kerugian akibat kegagalan perbaikan karena kurangnya kapasitas - 5 sarang. unit Kerugian akibat downtime spesialis dan peralatan tanpa adanya aplikasi - 6 hari. unit untuk setiap aplikasi.



Memberikan informasi mengenai kapasitas studio yang akan dibuat dengan menggunakan kriteria yang diberikan.

Larutan. Pemain A disini adalah badan yang mengambil keputusan mengenai kapasitas studio yang dibuat. Strategi murninya adalah:

■ A 1 - pembukaan studio dengan kapasitas 2 ribu televisi per tahun;

§ A 2 - pembukaan studio dengan kapasitas 4 ribu televisi per tahun;

■ A 3 - pembukaan studio dengan kapasitas 6 ribu televisi per tahun;

■ A 4 - pembukaan studio dengan kapasitas 8 ribu televisi per tahun.

Pemain kedua adalah totalitas dari semua keadaan di mana aliran permintaan perbaikan TV di studio terbentuk, yaitu. alam P. Alam dapat mewujudkan salah satu dari empat keadaan:

hal 1- alirannya akan menjadi 2 ribu TV per tahun;

■ P g - alirannya akan menjadi 4 ribu televisi per tahun;

hal 3- alirannya akan menjadi 6 ribu TV per tahun;

§ hal 4- alirannya akan menjadi 8 ribu TV per tahun.

Mari kita hitung imbalan dari pemain A dalam kombinasi keadaan apa pun ( A saya , Pk). Situasi yang paling menguntungkan adalah ketika jumlah aplikasi yang diterima sesuai dengan kemampuan studio.

Untuk kombinasi ( SEBUAH 1, P 1) keuntungannya menjadi 11 = 2 * 9 = 18 ribu. satuan, untuk kombinasi ( SEBUAH 2, P 2) kita punya 22 = 4 * 9 = 36 ribu sarang. unit dll.

Untuk kasus ( A 1, hal 2) di studio Anda dapat memperbaiki 2 ribu televisi, dan 4 ribu lamaran diterima, kerugian dalam hal ini adalah 2 * 5 = 10 ribu. unit, dan total keuntungan a n =2*9-2*5=8 ribu sarang. unit

Untuk kasus ( A saya , Pk) di studio Anda dapat memperbaiki 4 ribu televisi, dan 2 ribu lamaran diterima, kerugian dalam hal ini adalah 2 * 6 = 12 ribu. unit, dan total keuntungan a 21 = 18-12 = 6 ribu den. unit Elemen lain dari matriks pembayaran juga ditemukan serupa. Hasil perhitungan disajikan pada tabel. 4.13.

Dari meja 4.13 maka harga bersih permainan tersebut lebih rendah

dan harga bersih atas game tersebut

Karena α ≠ β, permainan tidak mengandung titik pelana. Ahli statistik tidak memiliki strategi dominan.____________

Kriteria Bayes. Biarkan probabilitas q k dari keadaan alami P k diketahui Dalam Tabel. 4.13 probabilitas ini ditetapkan sebagai . Dengan menggunakan rumus (4.23) kita mencari nilai rata-rata kemenangan. Nilai-nilai ini diberikan di kolom ketujuh tabel. 4.13. Optimal menurut kriteria Bayes, strategi murni A 3 (membuka bengkel untuk 6 ribu perbaikan per tahun) diterima, di mana keuntungan rata-rata adalah statistik .

Tabel 4.13

hal 1(2) hal 2(4) hal 3(6) hal 4(8) saya 0,8α saya saya 0,2δi Hai
Sebuah 1 (2) -2 -12 -12 3,5 -9,6 3,6 -6
Sebuah 2 (4) 23,5 4,8 7,2
Sebuah 3 (6) -6 -6 29,5 -4,8 10,8
Sebuah 4 (8) -18 -18 25,5 -14,4 14,4
β saya
0,2 0,35 0,25 0,2
0,25 0,25 0,25 0,25

Notasi berikut digunakan di sini:

Kriteria Laplace. Menurut kriteria ini, probabilitas diasumsikan sama dan dihitung menggunakan rumus

Strategi murni A 3 juga diterima sebagai optimal menurut kriteria Laplace, yang mana statistik hasil rata-ratanya

Kriteria biadab. Untuk menganalisis permainan menggunakan metode ini, kami akan membuat matriks risiko. Rumus (4.21), (4.22) digunakan untuk perhitungan. Hasil perhitungan disajikan pada tabel. 4.14.

Sebagai berikut dari tabel. 4.14, minimum dari seluruh risiko maksimum adalah sama dengan . Risiko ini sesuai dengan strategi murni A 3 (membuka bengkel untuk 6 ribu perbaikan per tahun).

Tabel 4.14

hal 1 hal 2 hal 3 hal 4 maks rik
Sebuah 1
Sebuah 2
Sebuah 3
Sebuah 4

Kriteria Wald. Dari meja 4.13 jelas bahwa harga bersih game tersebut lebih rendah . Harga ini sesuai dengan strategi murni A g (membuka studio dengan 4 ribu perbaikan per tahun).

Kriteria Hurwitz. Misalkan γ = 0,8. Kami menghitung menggunakan rumus saya= max a ik (lihat kolom 10 Tabel 4.13). Kemudian, menggunakan data pada kolom 6 dan 10 tabel. 4.13, kita melakukan perhitungan menggunakan rumus.

Hasilnya disajikan pada kolom 12 tabel. 4.13. Makna dan cocok dengan strategi Sebuah 2(buka studio untuk 4 ribu perbaikan per tahun).

Kriteria Laplace

Dalam beberapa kasus, alasan berikut tampaknya masuk akal: karena keadaan alam di masa depan tidak diketahui, maka hal tersebut dapat dianggap sama-sama mungkin terjadi. Pendekatan solusi ini digunakan dalam kriteria “alasan tidak mencukupi” Laplace.

Untuk menyelesaikan masalah ini, untuk setiap solusi, ekspektasi matematis dari keuntungan dihitung (probabilitas keadaan alamiah diasumsikan sama dengan qj = 1/n, j = 1:n), dan solusi dipilih di mana nilai keuntungan ini maksimal.

Hipotesis mengenai ekuiprobabilitas keadaan alam cukup dibuat-buat, sehingga prinsip Laplace hanya dapat digunakan dalam kasus-kasus tertentu. Lebih lanjut kasus umum kita harus berasumsi bahwa keadaan alam tidak mungkin terjadi dan menggunakan kriteria Bayes-Laplace untuk menyelesaikannya.

Kriteria Bayes-Laplace

Kriteria ini berangkat dari kondisi ketidakpastian total - kriteria ini mengasumsikan bahwa kemungkinan keadaan alam dapat diberi probabilitas tertentu terjadinya dan, setelah menentukan ekspektasi keuntungan matematis untuk setiap keputusan, pilih salah satu yang memberikan nilai keuntungan terbesar:

Metode ini mengasumsikan kemungkinan menggunakan informasi awal tentang keadaan alam. Hal ini mengasumsikan adanya pengulangan keadaan alam dan pengulangan keputusan, dan, yang terpenting, ketersediaan data yang cukup andal tentang keadaan alam di masa lalu. Artinya, berdasarkan pengamatan sebelumnya, memprediksi keadaan alam di masa depan (prinsip statistik).

Kembali ke tabel 1, mari kita asumsikan bahwa q1=0,4, q2=0,2 dan q3=0,4. Kemudian, menurut kriteria Bayes-Laplace, kami melengkapi Tabel 1 dengan kolom ekspektasi matematis dan memilih nilai maksimum di antara nilai-nilai ini. Kami mendapatkan tabel 13.

Tabel 13.

Solusi optimalnya adalah X1.

Kriteria Bayes-Laplace menerapkan persyaratan berikut pada situasi di mana keputusan dibuat:

  • v peluang terjadinya keadaan Bj diketahui dan tidak bergantung pada waktu;
  • v solusinya diimplementasikan (secara teoritis) berkali-kali;
  • v untuk sejumlah kecil implementasi solusi, beberapa risiko dapat diterima.

Dengan jumlah penerapan yang cukup besar, nilai rata-rata secara bertahap menjadi stabil. Oleh karena itu, dengan implementasi penuh (tanpa batas), segala risiko dihilangkan.

Posisi awal pengguna - kriterianya lebih optimis dibandingkan dengan kriteria Wald, namun mengasumsikan lebih banyak level tinggi kesadaran dan implementasi yang cukup lama.

Kriteria yang tercantum tidak menghabiskan seluruh variasi kriteria untuk memilih solusi dalam kondisi ketidakpastian, khususnya kriteria untuk memilih strategi campuran terbaik, namun hal ini cukup untuk membuat masalah pemilihan solusi menjadi ambigu:

Tabel 14. Pilihan optimal diperoleh dengan menggunakan berbagai kriteria

Dari Tabel 14 jelas bahwa pilihan solusi optimal bergantung pada kriteria yang dipilih (dan, pada akhirnya, pada asumsi).

Pemilihan kriteria (serta pemilihan prinsip optimalitas) merupakan tugas yang paling sulit dan penting dalam teori pengambilan keputusan. Namun, situasi tertentu tidak pernah begitu pasti sehingga tidak mungkin memperoleh setidaknya sebagian informasi mengenai distribusi probabilitas keadaan alamiah. Dalam hal ini, setelah memperkirakan distribusi probabilitas keadaan alam, metode Bayes-Laplace digunakan, atau percobaan dilakukan untuk memperjelas perilaku alam.

Karena kriteria yang berbeda dikaitkan dengan kondisi berbeda di mana keputusan dibuat, cara terbaik untuk membandingkan rekomendasi kriteria tertentu adalah dengan memperoleh informasi tambahan tentang situasi itu sendiri. Khususnya, jika keputusan yang diambil menyangkut ratusan mesin dengan parameter yang sama, maka disarankan untuk menggunakan kriteria Bayes-Laplace. Jika jumlah mesin tidak banyak, sebaiknya menggunakan kriteria minimax atau Savage.

Contoh rumusan pemecahan masalah

Pada bagian ini, dengan menggunakan contoh pemecahan masalah, kita harus belajar menentukan vektor strategi, vektor keadaan dan matriks pembayaran serta menerapkan berbagai kriteria untuk mendapatkan solusi optimal.

Tugas. Diputuskan untuk membuka klub kapal pesiar di kota tepi pantai. Berapa banyak kapal pesiar yang harus dibeli (berdasarkan: satu kapal pesiar untuk 5 orang), jika perkiraan jumlah anggota klub berkisar antara 10 hingga 25 orang. Langganan tahunan dikenakan biaya 100 unit mata uang. Harga kapal pesiar adalah 170 unit moneter. Menyewa tempat dan menyimpan kapal pesiar berharga 730 unit moneter per tahun.

Larutan. Tidak diragukan lagi, masuk akal untuk mempertimbangkan jumlah kapal pesiar yang akan dibeli dalam kisaran dua hingga lima (4 opsi) dan jumlah calon kapal pesiar dari 10 hingga 25. Untuk mengurangi volume pencacahan, kami akan membatasi diri pada opsi 10 , 15, 20, 25 (jika kesimpulan yang diperoleh untuk opsi terkait sangat bervariasi, kami akan melakukan perhitungan tambahan yang memperjelas). Jadi: X= (Xi) = (2, 3, 4, 5) - jumlah kapal pesiar (i=1,2,3,4); B = (Bj) =(10, 15, 20, 25) - jumlah anggota klub kapal pesiar (j=1,2,3,4).

Untuk mulai mencari solusi, kita akan membuat matriks keputusan, yang elemen-elemennya menunjukkan keuntungan ketika mengambil keputusan ke-i dengan jumlah anggota klub kapal pesiar ke-j:

aij = 100 menit(5Xi ; Bj) - 170Xi - 730

itu. aturan yang menentukan dalam masalah kita dirumuskan sebagai “pendapatan - biaya”.

Setelah melakukan perhitungan sederhana, mari kita isi matriks keputusan (aij) (lihat Tabel 15):

solusi matriks permainan teori

Tabel 15. Matriks pembayaran

Misalnya, a11 = 100 menit(52, 10) - 1702-730 =-70

a12=100 menit(52, 15)-1702-730=-70

a13 = a14 = -70 (permintaan kapal pesiar akan tetap tidak terpenuhi). Nilai negatif menunjukkan bahwa dengan rasio permintaan kapal pesiar dan ketersediaannya, klub kapal pesiar mengalami kerugian.

Kriteria Wald (pilihan strategi yang hati-hati dan pesimistis) - untuk setiap alternatif (jumlah kapal pesiar di klub) situasi terburuk dipilih ( nilai terkecil jumlah keuntungan) dan di antaranya jaminan efek maksimum ditemukan:

ZMM=maks(-70; -240; -410; -580)=-70

Kesimpulan: ketika mengambil keputusan menggunakan kriteria Wald, klub kapal pesiar harus membeli 2 kapal pesiar dan perkiraan kerugian maksimum tidak akan melebihi CU 70.

Kriteria Hurwitz (solusi kompromi antara hasil terburuk dan hasil yang terlalu optimis). Mari kita pertimbangkan perubahan dalam solusi masalah kita tergantung pada nilai koefisien optimisme (pada Tabel 16, nilai yang memenuhi kriteria Hurwitz disorot berbeda):

Tabel 16. Solusi Hurwitz untuk berbagai macam

Kesimpulan: pada 0,5 Anda harus membeli 5 kapal pesiar dan mengharapkan untung sekitar 170 rubel. (kami berharap untuk popularitas klub kami yang luas dan kelayakan finansial tertentu dari para amatir), pada = 0,2 kami tidak boleh membeli lebih dari 2 kapal pesiar (kami lebih berhati-hati dalam perkiraan kami dan, kemungkinan besar, akan lebih memilih untuk menolak membuat a klub).

Kriteria Savage (menemukan risiko minimum). Saat memilih solusi berdasarkan kriteria ini, matriks utilitas pertama-tama dibandingkan dengan matriks penyesalan D - misalnya, dengan mengurangkan (-70) dari kolom pertama matriks utilitas, 260 dari kolom kedua, 590 dan 920 dari kolom ketiga dan keempat, kita memperoleh matriks risiko (lihat tabel 17):

Tabel 17. Matriks Risiko

Nilai terkecil di antara elemen baris maksimum (nilai yang disorot dalam tabel) adalah:

ZS=min(990; 660; 340; 510)=340

Kesimpulan: dengan membeli 4 kapal pesiar untuk klub kapal pesiar yang kami buka, kami yakin dalam kasus terburuk, kerugian klub tidak akan melebihi CU 340.

Kriteria keputusan Bayes-Laplace. Mari kita asumsikan bahwa ada data statistik yang memungkinkan kita memperkirakan probabilitas permintaan tertentu untuk keanggotaan di klub kapal pesiar: q=(0.1; 0.2; 0.4; 0.3). Kemudian ekspektasi matematis dari nilai keuntungan untuk setiap opsi solusi yang dipertimbangkan (pasokan kapal pesiar di klub kapal pesiar):

a1r = (-700.1)+(-700.2)+(-700.4)+(-700.3) =-70 ,

a2r= (-2400.1)+(2600.2)+(2600.4)+(2600.3) =210;

a3r = 390; a4r = 370.

Kesimpulan: dalam kondisi situasi yang sedang dipertimbangkan, paling disarankan untuk membeli 4 kapal pesiar (dalam hal ini, keuntungan maksimum yang diharapkan dari klub kapal pesiar adalah 390 unit moneter).

Untuk menerapkan kriteria Laplace kita menemukan:

a1r = ((-70)+(-70)+(-70)+(-70)) / 4 = -70 ;

a2r = ((-240)+(260)+(260)+(260)) / 4 =135;

a3r = 215; a4r = 170.

Kesimpulan: dalam kondisi probabilitas yang sama terjadinya permintaan keanggotaan di klub kapal pesiar, Anda harus membeli 4 kapal pesiar dan pada saat yang sama Anda dapat mengandalkan keuntungan sebesar CU 215.

Kesimpulan umum. Kriteria yang dipertimbangkan mengarah pada berbagai keputusan dan dengan demikian memberikan bahan pemikiran ( keputusan di sini akan sangat bergantung pada psikologi dan intuisi subjek keputusan). Hal ini tidak mengherankan, karena kriterianya didasarkan pada hipotesis yang berbeda. Dengan memperkenalkan hipotesis tertentu tentang perilaku lingkungan, dengan demikian kita “menghilangkan ketidakpastian”, tetapi hipotesis itu sendiri hanyalah asumsi, bukan pengetahuan. Aneh jika asumsi yang berbeda selalu membuahkan hasil yang sama.

Pengambilan keputusan di bawah risiko

Seperti disebutkan di atas, pengambilan keputusan dalam kondisi berisiko ditandai dengan adanya perilaku alam (lingkungan) yang acak. Hal ini diwujudkan dalam kenyataan bahwa ada ukuran probabilitas tertentu yang sesuai dengan munculnya (terjadinya) keadaan alam tertentu. Pada saat yang sama, wajah Solusi yang diberikan mempunyai informasi tertentu tentang kemungkinan munculnya keadaan lingkungan, yang sifatnya bisa sangat beragam. Misalnya, ada tiga keadaan lingkungan B1, B2 dan B3, maka informasi tambahan tentang terjadinya keadaan-keadaan ini mungkin adalah keadaan B1 yang paling kecil kemungkinannya dan keadaan B3 yang lebih mungkin terjadi.

Akibatnya, pengambilan keputusan dalam kondisi risiko melibatkan, selain menentukan fungsi implementasi, juga menentukan beberapa hal informasi tambahan tentang kemungkinan keadaan lingkungan. Jika himpunan keadaan alami B berhingga (jumlah keadaan sama dengan m), maka ukuran probabilitas pada himpunan tersebut dapat ditentukan dengan vektor probabilitas q=(q1, q2, …, qm), dimana qj?0 Dan.

Dengan demikian, matriks payoff pada kondisi risiko dapat disajikan sebagai berikut (lihat Tabel 1)

Status lingkungan

Saat memilih solusi Xi, pemain mengetahui bahwa dia akan menerima salah satu hadiah a11, ..., a1m dengan probabilitas masing-masing q1, ..., qm. Akibatnya, hasil bagi pengambil keputusan ketika memilih solusi Xi adalah variabel acak

Jadi, membandingkan dua solusi X1 dan X2 berarti membandingkan variabel acak yang bersesuaian.

Pemilihan solusi optimal biasanya didasarkan pada salah satu kriteria berikut:

  • 1) Kriteria Bayes-Laplace - nilai yang diharapkan (keuntungan atau beban);
  • 2) kombinasi nilai yang diharapkan dan varians;
  • 3) kriteria produk;
  • 4) peristiwa yang paling mungkin terjadi di masa depan dan lain-lain.

Mari kita lihat lebih dekat kriteria Bayes-Laplace.

Tes nilai yang diharapkan (uji Bayes-Laplace)

Pada kuliah terakhir kita membahas kriteria Bayes-Laplace. Penggunaan kriteria ini (nama lain ditemukan dalam literatur - kriteria “nilai rata-rata yang diharapkan”) disebabkan oleh keinginan untuk memaksimalkan keuntungan yang diharapkan (atau meminimalkan biaya yang diharapkan). Penggunaan nilai yang diharapkan menyiratkan kemungkinan penyelesaian masalah yang sama berulang kali sampai diperoleh nilai yang cukup akurat. rumus perhitungan. Secara matematis terlihat seperti ini: misalkan o adalah variabel acak dengan ekspektasi matematis Mo dan varians Do. Jika x1, x2,..., xn adalah nilai variabel acak(s.v.) oh, lalu rata-rata aritmatika dari nilai (rata-rata sampel) mereka

memiliki varians. Jadi, ketika n>

Dengan kata lain, dengan ukuran sampel yang cukup besar, selisih antara mean aritmatika dan ekspektasi matematis cenderung nol (yang disebut teorema limit teori probabilitas). Oleh karena itu, penggunaan kriteria “nilai yang diharapkan” hanya valid jika solusi yang sama harus diterapkan berkali-kali. Hal sebaliknya juga terjadi: berfokus pada ekspektasi akan menghasilkan hasil yang salah untuk keputusan yang harus diambil berkali-kali.

Sebelum beralih ke modifikasi kriteria Bayes-Laplace, mari kita pertimbangkan kriteria ini lebih detail.

Diketahui bahwa karakteristik numerik alami dari variabel acak o adalah ekspektasi matematisnya Mo, yang mendekati nilai rata-rata variabel acak ini dalam sejumlah besar pengujian.

Jika seseorang yang menentang alam memiliki data statistik tentang pola manifestasi alam tertentu, maka masalahnya dapat dengan mudah diselesaikan dengan menggunakan metode probabilistik.

Jadi, jika probabilitas keadaan alam diketahui dan tidak berubah seiring waktu (stasioner), maka solusi yang memaksimalkan keuntungan yang diharapkan (yang memberikan ekspektasi keuntungan matematis terbesar terhadap strategi keadaan atau kondisi alam yang diketahui) seharusnya dianggap optimal.

Contoh. Perusahaan membeli mesin tersebut seharga 100 unit moneter. Untuk memperbaikinya, Anda bisa membeli peralatan khusus sebanyak 50 unit. atau puas dengan peralatan lama. Jika suatu mesin rusak, perbaikannya dengan bantuan peralatan khusus membutuhkan biaya 10 unit, tanpa peralatan khusus - 40 unit. Diketahui bahwa selama masa pakainya, suatu mesin mengalami kegagalan tidak lebih dari tiga kali: kemungkinan mesin tidak rusak adalah 0,3; istirahat 1 kali - 0,4; istirahat 2 kali - 0,2; istirahat 3 kali - 0,1. Penting untuk menentukan kelayakan pembelian peralatan perbaikan khusus.

Formalisasi. Pemain pertama memiliki dua strategi murni: membeli (X1) dan tidak membeli (X2) peralatan perbaikan khusus. Alam, pemain kedua, memiliki empat keadaan: mesin tidak akan gagal, akan gagal sekali, akan rusak dua kali, dan akan rusak tiga kali. Fungsi pembayaran adalah biaya perusahaan untuk pembelian dan perbaikan mesin, yang ditentukan oleh matriks pembayaran (lihat Tabel 1):

Tabel 1.

Kegagalan mesin

B1, tidak pernah

X1, jangan beli

X2, beli

Larutan. Pertama-tama mari kita anggap masalah ini sebagai permainan antagonis. Dengan menggunakan metode minimax, kita mencari titik pelana pada matriks: (X2, B4), jadi harga permainan tersebut adalah v= - 180 unit moneter (lihat Tabel 2).

Meja 2.

Kegagalan mesin

B1, tidak pernah

X1, jangan beli

X2, beli

Jawaban: Anda perlu membeli peralatan khusus.

Namun, dalam permainan dengan alam, situasinya berubah secara radikal: kondisi tersebut sudah mengandung strategi campuran alam yang stabil: q = (0,3; 0,4; 0,2; 0,1) dan kita tahu bahwa strategi inilah yang dianut oleh alam.

Jika seseorang - pemain pertama - terus bermain secara maksimal, maka bayarannya adalah M=-150Х0.3-160Ч0.4-170Ч0.2-180Ч0.1=-161, dan jika dia menggunakan yang pertama, tidak optimal strategi, maka ekspektasi matematisnya kemenangannya adalah M=-100Х0.3 - 140Х0.4 - 180Х0.2 -220Х0.1 =-144.

Oleh karena itu, menguntungkan bagi pemain pertama yang bermain secara kurang optimal!

Tabel 3.

Kegagalan mesin

B1, tidak pernah

X1, jangan beli

X2, beli

Jawaban: jangan membeli peralatan khusus.

Perbedaan yang signifikan antara nilai v(x*) dan v(x") dijelaskan oleh fakta bahwa strategi campuran alam tidak optimal dan, dengan “menyimpang” dari strategi optimalnya, ia “kalah” 36 unit moneter kemenangan.

Jadi, dalam permainan yang bersifat alami, orientasi terhadap ekspektasi kemenangan matematis sebenarnya merupakan orientasi terhadap rata-rata kemenangan yang diperoleh jika permainan ini diulang berkali-kali (dengan asumsi kondisi permainan tidak berubah). Tentu saja, jika permainan tersebut benar-benar diulang berkali-kali, maka kriteria keuntungan rata-rata (misalnya, dalam masalah ekonomi - keuntungan rata-rata) dapat dianggap dapat dibenarkan. Namun, apakah masuk akal untuk berfokus pada kriteria ini dalam satu tes?

Perhatikan contoh berikut. Perusahaan I dapat menjual salah satu barang TI1 atau TI2, dan perusahaan II dapat menawarkan salah satu barang TII1, TII2, TII3. Barang TI1 dan TII1 bersifat kompetitif (misalnya bir dan limun), dan barang TI1 dan TII3 bersifat saling melengkapi (misalnya bir dan kecoak); produk lain bersifat netral. Keuntungan perusahaan I bergantung pada kombinasi barang yang ditawarkan untuk dijual oleh kedua perusahaan, dan ditentukan oleh tabel 4. Diketahui bahwa perusahaan II menjual produk TII3 tiga kali lebih jarang dibandingkan TII1 dan empat kali lebih jarang dibandingkan TII2 . Produk manakah yang harus dijual ke perusahaan I?

Tabel 4

Status lingkungan

Berikut adalah keputusan untuk dijual oleh perusahaan I produk TI1, keputusan X2 untuk dijual oleh perusahaan I produk TI2.

Mari kita hitung ekspektasi matematis untuk tabel ini:

M=8H3/8+18H4/8+40H1/8=17, M=18H3/8+15H4/8+14H1/8=16.

Strategi optimal adalah solusi X1, yaitu. Perusahaan I memasok barang ke TI1. Tentu saja, imbalan 17 unit moneter lebih baik daripada 16. Namun, ketika memilih solusi X1, kita tidak akan menerima 17 unit moneter, tetapi salah satu kemenangan: 8, 18 atau 40. Ketika memilih solusi X2, kita tidak akan menerima 16 unit moneter, tetapi salah satu dari kemenangan 18, 15 atau 14. Mari kita buat tabel yang menunjukkan penyimpangan kemungkinan kemenangan dari nilai yang diharapkan dan kemungkinan penyimpangan ini.

Tabel 5. Nilai deviasi

Tabel ini menunjukkan bahwa dengan ekspektasi kemenangan yang sama, deviasi dari ekspektasi kemenangan mengarah secara berbeda: untuk X1 deviasi ini signifikan, dan untuk X2 relatif kecil.

Dari analisis tersebut kita dapat menyimpulkan: dalam kondisi risiko, kriteria Bayes-Laplace (keuntungan rata-rata yang diharapkan) tidak memadai dan harus diubah dengan mempertimbangkan kemungkinan penyimpangan variabel acak dari nilai rata-ratanya.

Dalam teori probabilitas, varians Do atau simpangan baku y= biasanya digunakan sebagai ukuran simpangan suatu variabel acak dari nilai rata-ratanya. Dalam masalah pengambilan keputusan dalam kondisi risiko, kami akan mempertimbangkan standar deviasi y sebagai indikator risiko, karena y mempunyai dimensi yang sama dengan variabel acak o, ekspektasi matematis Mo.

Jadi, untuk mengambil keputusan dalam kondisi berisiko, pemilihan alternatif Xi mengarah pada variabel acak oi, yang dapat dicirikan oleh sepasang indikator (Mo, уi). Sekarang mari kita mulai membangun kriteria yang memadai untuk membandingkan alternatif. Faktanya, di sini kita mendapatkan masalah optimasi dua kriteria, dimana kriteria parsialnya adalah ekspektasi matematis Mo (nilai kriteria ini perlu dimaksimalkan) dan simpangan baku y (nilai kriteria ini perlu diminimalkan).

Mari kita pertimbangkan untuk menemukan solusi optimal Pareto untuk masalah multikriteria ini. Misalkan kita perlu memilih satu solusi optimal dari sekumpulan solusi layak, yang masing-masing ditentukan oleh sepasang indikator (Moi, уi). Dengan menggambarkan titik-titik dengan koordinat (Moi, уi) pada bidang koordinat, kita memperoleh gambaran seperti yang ditunjukkan pada Gambar. 1, yaitu kami mendapat ruang perkiraan. Sisi kiri arti gambar (titik merah). ekspektasi matematis kami mengambil nilai positif dan y negatif, karena Kita harus meminimalkan kriteria ini (y). Perkiraan optimal Pareto adalah yang tepat batas atas dan, karenanya, solusi optimal Pareto X1, X2, X9 dan X7.

Dalam contoh ini, himpunan solusi optimal Pareto adalah X1, X2, X9, X7 dan pemilihan akhir solusi optimal dibuat dari himpunan ini. Seperti disebutkan di atas, ada dua pendekatan di sini: pendekatan pertama adalah serangkaian solusi optimal Pareto dibangun dan dari rangkaian ini pengambil keputusan memilih solusi unik berdasarkan pertimbangan tambahan informal. Mari kita pertimbangkan pendekatan kedua berdasarkan penyempitan rangkaian alternatif optimal Pareto.

  • 1. Pemilihan kriteria utama dan penetapan batas bawah kriteria lainnya. Mari kita tetapkan batas bawah menurut kriteria M dan minimalkan kriteria y. Sebagai batas bawah kriteria M kita ambil nilai M4 (lihat Gambar 1), maka solusi optimalnya adalah X2, jadi diantara solusi yang memenuhi kondisi Mi? M4, ini adalah yang paling tidak berisiko.
  • 2. Optimasi leksikografis melibatkan pengurutan kriteria berdasarkan kepentingannya. Misalnya, M menjadi kriteria yang paling penting. Karena satu-satunya solusi X7 mempunyai nilai maksimum menurut kriteria M, maka solusi tersebut optimal. Hal ini jelas menunjukkan kelemahan metode optimasi leksikografis: dengan mempertimbangkan satu kriteria (paling penting). Kelemahan ini terkait dengan perlunya memperkenalkan kriteria prioritas yang ketat dan dapat dihilangkan dengan melemahkan “kekakuan” prioritas. Dalam hal ini digunakan metode konsesi berturut-turut (metode perubahan tujuan), yang telah dibahas di atas.

Misalnya, dalam kasus kami, sebagai konsesi menurut kriteria M, nilai D ditunjukkan pada Gambar. 1. Maka hasil pilihan pada langkah pertama adalah alternatif X7, X8, X9. Di antara mereka, yang terbaik menurut kriteria kedua adalah X9. Jadi, dengan sedikit menurunkan persyaratan untuk kriteria M, kami secara signifikan meningkatkan penilaian untuk kriteria y (yaitu, sedikit penurunan pada keuntungan yang diharapkan menyebabkan penurunan risiko yang signifikan).


Beras. 1.

Mari kita pertimbangkan penerapan kriteria umum untuk masalah kita. Mari kita ambil fungsi bentuk sebagai kriteria umum:

f(M, y)= M-lChu, (1)

dimana l adalah suatu nilai konstan. Faktanya, kriteria (1) mewakili kriteria optimalitas aditif untuk kriteria parsial M,y dengan koefisien bobot 1 dan -l. Ketika n>0, estimasi variabel acak menggunakan kriteria aditif (1) lebih kecil dari nilai rata-ratanya, yang merupakan tipikal untuk orang yang berhati-hati, yaitu. orang yang menghindari risiko. Sebaliknya, ketika l<0 оценка (1) выше, чем среднее значение, что характеризует человека, склонного к риску. Наконец, при л=0 оценка случайной величины совпадает с её средним значением (т.е. возможные отклонения случайной величины от её среднего значения игнорируются) - это характеризует человека, безразличного к риску.

Arti substantif dari kriteria penjumlahan (1) untuk n>0 adalah peningkatan kriteria f(M,y) dapat terjadi baik karena kenaikan M maupun karena penurunan y. Jadi, bagi orang yang menghindari risiko, kriteria (1) mencerminkan keinginan untuk meningkatkan keuntungan yang diharapkan dan mengurangi risiko penyimpangan darinya. Dalam hal ini, indikator l mencirikan sikap subjektif pengambil keputusan terhadap risiko. Oleh karena itu, l dapat dianggap sebagai indikator subyektif dari ukuran penghindaran risiko (subjective Indicator of Hati-hati).

Memilih varian produk yang akan diproduksi. Perusahaan dapat memproduksi produk dari enam jenis berikut: payung (Z), jaket (K), jas hujan (P), tas (S), sepatu (T) dan (W). Pimpinan perusahaan harus memutuskan jenis produk mana yang akan diproduksi selama musim panas mendatang. Keuntungan perusahaan bergantung pada jenis musim panas apa yang akan terjadi - hujan, panas atau sedang, dan ditentukan oleh tabel 6. Opsi produksi manakah yang optimal?

Dengan tidak adanya informasi tambahan tentang keadaan lingkungan dalam kondisi ketidakpastian, penyelesaiannya dimungkinkan dengan menerima hipotesis apa pun tentang perilaku lingkungan. Jika pengambil keputusan mempunyai informasi tentang kemungkinan terjadinya musim panas yang hujan, panas, dan sedang, maka masalah yang ditentukan menjadi masalah pengambilan keputusan yang berisiko. Dalam hal ini, informasi yang diperlukan dapat diambil dari data statistik (pengamatan cuaca di suatu daerah). Mari kita asumsikan probabilitas terjadinya musim panas yang hujan, panas, dan sedang masing-masing adalah 0,2, 0,5, dan 0,3. Lalu kita mendapatkan masalah pengambilan keputusan dalam kondisi berisiko, diberikan oleh tabel 7.

Tabel 6.

Mari kita cari imbalan yang diharapkan sesuai dengan solusi Z, K, P, S, T, W. Kita mempunyai:

MZ=0,2H80+0,5H60+0,3H40=58,

Mk=0,2H70+0,5H40+0,3H80=58,

MP=0,2H70+0,5H50+0,3H60=57,

MS=0,2H50+0,5H50+0,3H70=56,

MT=0,2H75+0,5H50+0,3H50=55,

DoZ=196, DoK=336, DoP=61, DoC=84, DoT=100, DoSh=231,5. Deviasi standar variabel acak yang dipertimbangkan adalah:

yZ=14,0, yK=18,3, yP=7,8, yS=9,2, yT=10,0, ySh=15,2.

Mari kita buat tabel nilai kriteria M dan y untuk setiap alternatif (Tabel 8)

tabel 8

Kriteria

Mari kita nyatakan solusi yang dipertimbangkan sebagai titik-titik pada bidang koordinat variabel M dan y, dan kita peroleh Gambar. 2, dimana solusi optimal Pareto adalah Z, P, Sh. Pilihan akhir dari alternatif optimal harus dibuat dari himpunan ini.

Penyempitan himpunan Pareto-optimal (idealnya menjadi satu elemen) hanya dapat dilakukan jika terdapat informasi tambahan mengenai hubungan antara kriteria M dan y. Seperti disebutkan di atas, hal ini dapat dilakukan dengan metode kriteria utama, metode konsesi berturut-turut, atau menggunakan kriteria leksikografis.

Tinjauan kriteria keputusan dalam kondisi risiko

Kriteria karya

Aturan seleksi dalam hal ini dirumuskan sebagai berikut:

Matriks keputusan dilengkapi dengan kolom baru yang berisi produk dari semua hasil setiap baris. Opsi-opsi tersebut dipilih yang berisi baris-baris nilai tertinggi kolom ini.

Penerapan kriteria ini disebabkan oleh keadaan berikut:

  • · kemungkinan terjadinya keadaan Bj tidak diketahui;
  • · Penampilan masing-masing negara bagian Bj secara terpisah harus diperhitungkan;
  • · kriteria ini juga berlaku untuk sejumlah kecil implementasi solusi;
  • · beberapa risiko dapat diterima.

Kriteria produk diadaptasi terutama untuk kasus-kasus di mana semua aij positif. Jika kondisi positif dilanggar, maka harus dilakukan pergeseran aij+a dengan konstanta a>. Hasilnya tentu saja akan bergantung pada a. Dalam praktiknya paling sering

Jika tidak ada konstanta yang dapat dianggap mempunyai arti, maka kriteria hasil kali tidak dapat diterapkan.

Sebelumnya Beranda Berikutnya

Pengambilan keputusan dalam kondisi berisiko dengan kemungkinan melakukan eksperimen

Ketika mengambil keputusan dalam kondisi ketidakpastian (atau dalam kondisi berisiko), kesulitan mendasar dalam memilih solusi muncul karena ketidaktahuan pengambil keputusan terhadap keadaan lingkungan yang sebenarnya. Pada kuliah sebelumnya, beberapa kriteria dipertimbangkan, yang masing-masing “memerangi” ketidakpastian dengan caranya sendiri: dengan mengajukan hipotesis tentang perilaku lingkungan (kriteria Laplace, Wald, Hurwitz dan Savage); dengan merata-ratakan keuntungan yang dihasilkan (kriteria Bayes-Laplace atau kriteria keuntungan yang diharapkan); dengan memperhitungkan keuntungan yang diharapkan dan ukuran penyimpangannya. Namun, masing-masing pendekatan ini hanya memberikan cara untuk menganalisis ketidakpastian secara rasional, tanpa menghilangkan ketidakpastian itu sendiri. Penghapusan atau setidaknya pengurangan ketidakpastian hanya dapat dilakukan atas dasar memperjelas keadaan lingkungan yang sebenarnya.

Dalam praktiknya, klarifikasi tersebut biasanya dilakukan dengan mengumpulkan informasi tambahan, serta dengan melakukan eksperimen, yang hasilnya digunakan untuk menilai keadaan lingkungan saat ini. Misalnya, sebelum memulai pengobatan pada pasien yang diagnosisnya tidak jelas, dokter melakukan tindakan tes tambahan; Sebelum mengebor sumur minyak yang mahal, seorang ahli geologi melakukan eksplorasi seismik; Sebelum memulai produksi produk apa pun, pengusaha membuat uji coba produk ini, dll. Dalam kerangka teori pengambilan keputusan, semua tindakan ini tidak lebih dari melakukan eksperimen untuk memperjelas keadaan lingkungan.

Suatu eksperimen disebut ideal jika, berdasarkan hasil-hasilnya, pengambil keputusan mengetahui keadaan lingkungan yang sebenarnya. Dalam praktiknya, jarang sekali terjadi eksperimen yang sempurna. Seringkali, hasil percobaan memberikan beberapa informasi yang dapat digunakan untuk memperjelas lingkungan.

Bagaimana cara menggunakan hasil percobaan dan data statistik yang tersedia saat mengambil keputusan dengan paling efektif? Salah satu cara untuk menyelesaikan masalah ini didasarkan pada rumus Bayes - rumus untuk memperkirakan kembali peluang suatu kejadian dengan mempertimbangkan hasil percobaan.

Perhatikan bahwa eksperimen ini tidak mungkin dilakukan untuk setiap masalah pengambilan keputusan. Jika suatu percobaan dimungkinkan untuk suatu tugas tertentu, maka timbullah tugas untuk menilai kelayakan pelaksanaannya. Faktanya melakukan suatu eksperimen selalu membutuhkan biaya (bahan, organisasi, waktu, dll).

[Rosen] menunjukkan bahwa eksperimen yang ideal akan menguntungkan jika dan hanya jika biayanya lebih kecil dari risiko minimum yang diharapkan:

dimana rij adalah risiko, C adalah biaya percobaan.

Untuk menyajikan pendekatan Bayesian dalam memperkirakan ulang probabilitas, mari kita mengingat beberapa konsep dari teori probabilitas.

Peluang bersyarat kejadian A jika kejadian B telah terjadi dilambangkan dengan P(A/B) dan dihitung dengan rumus

Mari kita pertimbangkan skema teori probabilitas berikut. Misalkan B1, B2, …, Bm adalah sekelompok kejadian lengkap dan untuk setiap kejadian Bj, j= diketahui peluangnya P(Bj). Misalkan suatu percobaan dilakukan yang mengakibatkan terjadinya peristiwa A. Jika peluang bersyarat P(A/Bj) untuk semua j= diketahui, maka peluang bersyarat (pasca-percobaan) dari kejadian Bj (j=, ) dapat dicari dengan menggunakan rumus Bayes

Sekarang mari kita pertimbangkan dalam bentuk skema masalah pengambilan keputusan dalam kondisi risiko, yang ditentukan menggunakan matriks pembayaran, yang berbentuk tabel.

Tabel 1. Matriks pembayaran dengan vektor probabilistik keadaan lingkungan

Status lingkungan

Di sini B1, B2, …, Bm adalah keadaan lingkungan, aij adalah hasil pemain dalam situasi ketika ia memilih strategi Xi, dan lingkungan mengambil keadaan Bj. Pengambil keputusan mengetahui peluang P(Bj)= qj terjadinya keadaan Bj, dan P(Bj)?0 dan. Diasumsikan bahwa medium berada pada satu dan hanya satu keadaan B1, B2, ..., Bm. Dengan kata lain kejadian acak B1, B2, ..., Bm membentuk kelompok kejadian yang lengkap, sehingga dapat diambil hipotesis. Probabilitas keadaan lingkungan yang diketahui oleh pengambil keputusan P(Bj) (j=) adalah probabilitas tanpa syarat (pra-eksperimental, apriori).

Mari kita asumsikan bahwa suatu eksperimen sedang dilakukan, yang hasilnya bergantung pada keadaan lingkungan yang ada. Jika, sebagai hasil percobaan, kejadian A diamati dan, sebagai tambahan, probabilitas bersyarat P(A/Bj) diketahui untuk semua j=, maka dengan menggunakan rumus Bayes, kita dapat mencari pasca-eksperimental (posterior) probabilitas setiap keadaan lingkungan. Pengetahuan tentang kemungkinan halus keadaan lingkungan memungkinkan Anda menentukan strategi pengambil keputusan dengan lebih akurat.

Pendekatan yang dijelaskan dalam pengambilan keputusan dalam risiko disebut Bayesian, karena didasarkan pada rumus Bayes. Pendekatan ini diilustrasikan oleh contoh yang dibahas di bawah ini.

Tugas. Pengeboran sumur minyak.

Ketua kelompok pencari harus mengambil keputusan: akan mengebor sumur minyak atau tidak. Sumur tersebut mungkin menjadi “kering” (C), mis. tanpa minyak, “daya rendah” (M), yaitu. dengan kandungan minyak rendah, dan “kaya” (B), yaitu. dengan kandungan minyak yang tinggi. Alternatif ketua kelompok adalah: x1 - mengebor dan x2 - tidak mengebor. Laba bersih ketika memilih salah satu alternatif, tergantung pada kemungkinan jenis sumur, ditunjukkan pada tabel keuntungan (lihat Tabel 1)

Tabel 1. Matriks pembayaran

Ketik dengan baik

Selain itu, pemimpin kelompok pencari mengetahui bahwa di suatu area tertentu kemungkinan sumur kering, tipis atau kaya adalah sebagai berikut: P(C)=0.5, P(M)=0.3, P(B)=0.2.

Ketua kelompok pencari dapat melakukan percobaan untuk memperjelas struktur tanah (keadaan lingkungan). Percobaan ini merupakan survei seismik yang hasilnya akan menjadi jawaban - bagaimana struktur tanah di suatu daerah (tetapi bukan jawaban atas pertanyaan tentang jenis sumur!). Pada prinsipnya struktur tanah dapat berupa terbuka (O) atau tertutup (C). Pemimpin kelompok mempunyai tabel hasil percobaan yang diberikan di bidang ini (lihat Tabel 2).

Tabel 2. Tabel data eksperimen

Tabel ini menunjukkan berapa kali sumur tipe C, M, B ditemukan pada tanah berstruktur terbuka dan tertutup (yaitu, tabel ini memberikan statistik gabungan tanah dan jenis sumur untuk area tertentu).

Mari kita menganalisis data eksperimen dari tabel yang dihasilkan. Misalkan telah dilakukan n percobaan yang hasilnya berupa nilai peubah acak diskrit X (tipe sumur) dan Y (struktur tanah), yang bernilai C, M, B dan O, Mari kita nyatakan dengan n11 jumlah percobaan yang X = C dan Y=O, setelah n12 jumlah percobaan yang X=C dan Y=Z, setelah n21 jumlah percobaan yang X=M dan Y=O, dst. Dalam kasus kita n=100, n11=45, n12=5, n21=11. Membagi nilai pada Tabel 2 dengan 100 (dengan jumlah percobaan yang dilakukan), kita memperoleh hukum distribusi variabel acak dua dimensi (X, Y) yang diberikan dalam bentuk tabel (lihat Tabel 3).

Tabel 3. Seri statistik distribusi r.v. (X, Y)

Dari Tabel 3 dapat disimpulkan bahwa P(X=C)=P(C)=0.5, P(X=M)=P(M)=0.3, P(X=B)=P(B)=0.2; (Y=O)=P(O)=0,6, P(Y=З)=P(З)=0,4,

Jadi, ketua kelompok harus memutuskan:

  • · apakah akan melakukan percobaan (biayanya 10 unit);
  • · Jika dilakukan, maka apa yang harus dilakukan kedepannya tergantung hasil percobaan.

Dengan demikian, diperoleh masalah pengambilan keputusan multi-langkah dalam kondisi risiko. Mari kita jelaskan metode untuk menemukan solusi optimal.

Langkah 1. Mari kita buat pohon (Gbr. 1), yang menunjukkan semua tahapan proses pengambilan keputusan - pohon keputusan. Cabang-cabang pohon berhubungan dengan kemungkinan alternatif, dan simpul berhubungan dengan situasi yang muncul. Alternatif ketua kelompok pencarian adalah: b - penolakan percobaan, c - melaksanakan percobaan, x1 - latihan, x2 - tidak latihan. Keadaan alam: pemilihan tipe sumur (C, M, B), serta pemilihan struktur tanah (O, W).

Pohon yang dibangun menentukan permainan pemimpin kelompok dengan alam. Posisi permainan ini adalah puncak pohon, dan gerakan para pemain adalah solusi yang mereka pilih. Posisi di mana pemimpin kelompok bergerak digambarkan dengan persegi panjang; posisi di mana alam bergerak dilingkari.

Permainan berlangsung sebagai berikut. Pada posisi awal, ketua kelompok melakukan gerakan. Dia harus mengambil keputusan - menolak eksperimen (pilih solusi b) atau melakukan eksperimen (pilih solusi c). Jika dia meninggalkan percobaan, maka permainan berpindah ke posisi berikutnya di mana ketua kelompok harus mengambil keputusan: melakukan pengeboran (pilih alternatif x1) atau tidak melakukan pengeboran (pilih alternatif x2). Jika dia memutuskan untuk melakukan percobaan, maka permainan berpindah ke posisi di mana alam bergerak, memilih salah satu keadaan O atau Z, sesuai hasil yang mungkin percobaan, dll. Permainan berakhir ketika mencapai posisi akhir (yaitu puncak pohon yang tidak ada cabang yang memancar darinya)

Langkah 2. Untuk setiap keputusan yang merupakan pergerakan alam (yaitu berasal dari posisi yang digambarkan oleh lingkaran), kita perlu mencari probabilitas pergerakan tersebut. Untuk melakukan ini, kami melanjutkan sebagai berikut. Untuk setiap posisi pohon, terdapat satu jalur yang menghubungkan posisi tersebut dengan posisi awal. Jika ini untuk posisi alam, jalur yang menghubungkannya dengan posisi awal tidak melalui posisi (E), artinya percobaan, maka peluang keadaan P(S), P(M) dan P(B ) tidak bersyarat (pra-eksperimental) dan berasal dari tabel. 3:

P(S)=50/100, P(M)=30/100, P(B)=20/100.

Jika untuk posisi alam, jalur yang menghubungkannya dengan posisi awal melewati posisi (E), maka peluang keadaan lingkungan menjadi peluang bersyarat dan dicari menurut rumus (1), dengan menggunakan data pada Tabel . 3:

Pada posisi (E), probabilitas pergerakan menuju posisi (O) dan (W) ditemukan dari Tabel 3: P(O)=0.6, P(Z)=0.4.


Beras. 1.

Langkah 3. Mari kita evaluasi semua posisi pohon permainan, “turun” dari posisi akhir ke posisi awal. Evaluasi suatu posisi adalah kemenangan yang diharapkan pada posisi tersebut. Kami menemukan perkiraan untuk posisi akhir dari Tabel 2. Kami sekarang menunjukkan metode untuk menemukan perkiraan untuk posisi arbitrer dari pohon permainan dengan asumsi bahwa perkiraan untuk semua posisi setelahnya telah ditemukan.

Untuk posisi alam, penilaiannya mencerminkan keuntungan yang diharapkan (lihat Gambar 2);

Untuk posisi seorang pemain, perkiraannya adalah maksimum dari seluruh posisi dibelakangnya. Motif: pada posisi “nya”, pemain dapat melakukan gerakan apa saja, sehingga ia akan memilih salah satu yang menghasilkan kemenangan sebesar-besarnya (lihat Gambar 3). Pada setiap posisi, pemain menandai dengan tanda hubung cabang pohon yang mengarah ke posisi dengan skor maksimal.


Mari kita beralih ke Gambar. 1. Diketahui bahwa pada posisi awal keuntungan yang diharapkan tanpa melakukan percobaan (alternatif b) adalah 20 unit; keuntungan yang diharapkan dengan percobaan (alternatif c) adalah 28 unit. Oleh karena itu, solusi yang tepat adalah dengan melakukan percobaan (eksplorasi seismik). Selanjutnya, jika dari percobaan menunjukkan tanah terbuka, maka pengeboran tidak boleh dilakukan, tetapi jika tertutup, maka pengeboran harus dilakukan.

  • 1 - cabang: =20
  • 2 - cabang: 0
  • 3 - cabang:= -30
  • 4 - cabang: 0
  • 5 - cabang: =95
  • 6 - cabang: 0

Sebagai berikut dari kondisi soal, diperoleh nilai 95 satuan dengan probabilitas 0,4. Oleh karena itu, kemenangan yang diharapkan adalah 0,4*95=38 unit. Kami mengurangi biaya percobaan sebesar 10 unit.

Hasilnya, kami mendapat 28 unit.

Pohon keputusan secara hierarki mewakili struktur logis pengambilan keputusan, dan dengan demikian memfasilitasi pemahaman masalah dan proses penyelesaiannya. Berbeda dengan matriks keputusan, di sini Anda dapat melihat jalannya waktu proses pengambilan keputusan. Namun, pohon keputusan secara umum tidak dapat diwakili oleh matriks keputusan sederhana; Hanya tahapan proses tertentu yang dapat direpresentasikan dengan cara ini. Pembagian ke dalam tahapan-tahapan dilakukan sedemikian rupa sehingga pemilihan solusi dimulai dari simpul keputusan tertentu, dari mana satu atau lebih cabang berasal, yang mewakili pilihan-pilihan solusi. Ini diikuti oleh node peristiwa dan di akhir - daun" mewakili keadaan akhir yang menunjukkan nilai parameter keluaran yang sesuai. Jika node peristiwa sekali lagi diikuti oleh simpul keputusan dengan tindakan yang sesuai, maka ini dan semua cabang berikutnya berhubungan dengan lebih banyak lagi tahap akhir memilih solusi.. Dengan demikian, Anda dapat menelusuri seluruh jalur dari awal hingga akhir pohon keputusan.

Pohon keputusan membedakan antara simpul peristiwa dan simpul keputusan. Dapat dibayangkan bahwa pada node peristiwa, pilihan jalur selanjutnya ditentukan kondisi eksternal(secara alami, dalam teori permainan oleh lawan), dan dalam simpul keputusan oleh pengambil keputusan.

Pohon keputusan mudah untuk dimodifikasi: jika perlu, pohon keputusan dapat dikembangkan lebih lanjut, dan jika beberapa cabang praktis tidak ada artinya, pohon keputusan dapat dikurangi. Node keputusan, jika dikaitkan dengan satu tindakan dan tidak dipisahkan oleh node peristiwa, dapat digabungkan. Hal yang sama berlaku untuk node peristiwa.



Baru di situs

>

Paling populer