[TULISAN] Teknik Solusi Teori Game Statis
Techniques for Solving & Weak
Dominance, Nash Equilibrium, dan Mixed Strategy Nash Equilibrium
A.
Techniques for Solving and Weak Dominance
Solusi untuk
permainan adalah prediksi tentang apa yang akan dilakukan oleh setiap pemain
dalam permainan itu. Ini mungkin merupakan prediksi yang sangat tepat, di mana
solusi memberikan satu strategi optimal untuk setiap pemain. Ketika ini
terjadi, solusinya dikatakan unik. Namun, sering terjadi bahwa solusi untuk
permainan tertentu kurang tepat, bahkan sejauh tidak ada strategi yang tersedia
yang dikesampingkan. Seperti yang diharapkan banyak teknik solusi yang berbeda
telah diusulkan untuk berbagai jenis permainan.
Untuk permainan
statis, dua teknik solusi telah diterapkan. Set pertama teknik solusi mengandalkan
konsep dominasi. Solusi ini untuk permainan ditentukan dengan mencoba untuk mengesampingkan
strategi manusia yang rasional tidak akan pernah dimainkan. Argumen berdasarkan
dominasi berusaha untuk menjawab pertanyaan "Strategi apa yang akan pemain
rasional tidak pernah dimainkan?" Set kedua teknik solusi didasarkan pada
konsep kesetimbangan. Dalam permainan non-kooperatif keseimbangan terjadi
ketika tidak ada pemain, bertindak secara individual, memiliki insentif untuk
menyimpang dari solusi yang diprediksi. Dengan teknik solusi ini, sebuah
permainan diselesaikan dengan menjawab pertanyaan “Properti apa yang perlu agar
menjadi solusi keseimbangan?”.
Pada bagian
berikut ini kita memeriksa berbagai teknik dominan yang dapat diterapkan untuk
permainan statis, dan dua konsep kesetimbangan.
a. Strict Dominance
Sebuah strategi dikatakan dominasi secara ketat jika
strategi lain selalu memberikan hasil yang lebih baik apa pun yang dilakukan
pemain lain dalam permainan. Teknik solusi ini membuat asumsi yang masuk akal
bahwa seorang pemain rasional tidak akan pernah memainkan strategi yang
benar-benar didominasi. Jika seorang pemain dengan sengaja memainkan strategi
yang sangat didominasi, mereka tidak dapat memaksimalkan hasil yang mereka
harapkan, mengingat keyakinan mereka tentang apa yang akan dilakukan pemain
lain.
Untuk mengilustrasikan teknik ini, kita
menggunakannya untuk memecahkan permainan dilema tahanan. Dalam menerapkan
prinsip strict dominanace, kita memeriksa setiap pemain secara bergantian dan
mengecualikan semua strategi yang benar-benar didominasi. Proses ini mungkin
mengesampingkan semua kecuali satu strategi untuk setiap pemain. Ini berlaku
untuk game dilema tahanan, dan teknik ini menghasilkan solusi unik untuk game
ini.
Pertimbangkan pertama dilema yang dihadapi tahanan
1. Haruskah dia mengaku atau haruskah dia tetap diam berharap tahanan lain
melakukan hal yang sama. Prinsip strict dominance berpendapat bahwa tahanan 1
harus mengaku. Alasannya adalah bahwa tahanan apa pun yang memutuskan untuk
melakukan tahanan 1 selalu lebih baik mengaku. Ini berarti tidak mengaku
benar-benar didominasi dan tampaknya masuk akal untuk menganggapnya tidak akan
dimainkan. Logika yang sama berlaku sama untuk narapidana 2 dan dominasi yang
begitu ketat meramalkan bahwa ia juga akan mengaku. Solusi untuk permainan ini
berdasarkan strict dominance adalah bahwa kedua tahanan mengaku meskipun
keduanya akan lebih baik jika tidak mengaku. Setidaknya salah satu pemain dalam
permainan ini dapat, dengan hasil yang berbeda, dibuat lebih baik tanpa pemain
lain yang dibuat lebih buruk dari solusi ini dikatakan tidak efisien (kenyataannya
jika kedua pemain tidak mengakui keduanya akan lebih baik).
b.
Weak Dominance
Suatu strategi dikatakan weak dominance jika
strategi lain membuat orang itu lebih baik dalam beberapa situasi dan membuat
mereka tidak peduli pada yang lain. Sekali lagi, tampaknya masuk akal untuk
mengasumsikan bahwa seorang pemain rasional tidak akan memainkan strategi yang
didominasi lemah, dan mungkin bahkan lebih baik, dengan memainkan strategi
dominan. Pertimbangkan permainan bentuk normal yang ditunjukkan pada gambar
dibawah.
Dalam game ini ada dua pemain masing-masing dengan
dua kemungkinan strategi. Pemain 1 dapat bergerak "naik" atau
"turun", dan pemain 2 dapat bergerak "kiri" atau
"kanan". Hasil diberikan dalam matriks, di mana angka pertama adalah
bayaran untuk pemain 1 dan angka kedua adalah hasil untuk pemain 2. Untuk
permainan ini tidak ada strategi yang tersedia dikesampingkan menggunakan
prinsip dominasi ketat. Ini karena tidak ada strategi yang membuat pemain itu
semakin buruk dalam semua keadaan. Sebagai contoh, jika pemain 1 memainkan
"naik" maka pemain 2 adalah acuh tak acuh antara "kiri" dan
"kanan". Demikian pula jika pemain 2 memainkan "kiri"
pemain 1 adalah acuh tak acuh antara "atas" dan "bawah".
B.
Nash Equilibrium
Nash Equilibrium
yang dimotivasi oleh pertanyaan" Sifat apa yang harus dimiliki
ekuilibrium? Jawaban untuk pertanyaan ini dari John Nash (1951), berdasarkan
pada karya sebelumnya oleh Cournot (1838), adalah bahwa dalam ekuilibrium
setiap strategi yang dipilih pemain adalah optimal mengingat setiap pemain lain
memilih strategi kesetimbangan. Jika ini tidak terjadi maka setidaknya satu
pemain akan ingin memilih strategi yang berbeda dan jadi kita tidak bisa berada
dalam kesetimbangan. Sekali lagi konsep ini berusaha untuk menerapkan asumsi
ekonom bahwa individu bersifat rasional dalam arti bahwa mereka berusaha untuk
memaksimalkan kepentingan diri mereka sendiri.
Menemukan Nash
Equilibrium untuk permainan apa pun melibatkan dua tahap. Pertama, kita
mengidentifikasi strategi optimal setiap pemain sebagai reaksi terhadap apa
yang mungkin dilakukan pemain lain. Ini melibatkan bekerja melalui setiap
pemain secara bergantian dan menentukan strategi optimal mereka. Dilakukan
untuk setiap kombinasi strategi oleh pemain lain. Kedua, Nash Equilibrium diidentifikasi
ketika semua pemain memainkan strategi optimal mereka secara bersamaan.
Untuk
mengilustrasikan metodologi dua tahap untuk menemukan keseimbangan (strategi
murni) Nash, kita menerapkannya pada permainan dilema narapidana. Ini
ditunjukkan pada gambar dibawah ini.
Tingkat Satu
Pertama-tama
kita perlu mengidentifikasi strategi optimal untuk setiap tahanan, tergantung
pada apa yang mungkin dilakukan tahanan lain. Jika tahanan 1 mengharapkan
tahanan 2 untuk mengaku maka strategi terbaik narapidana 1 juga untuk mengaku (-6
lebih baik daripada -9). Dengan menggarisbawahi elemen pembayaran ini untuk
napi 1 di sel yang sesuai dengan kedua narapidana mengaku. Jika tahanan 1
mengharapkan narapidana 2 tidak mengaku, maka strategi terbaik narapidana masih
untuk mengaku (saat ini 0 lebih baik dari -1). Sekali lagi kita menunjukkan ini
dengan menggarisbawahi elemen pembayaran ini untuk narapidana 1. Analisis yang
sama dilakukan untuk napi 2 dan imbalan strategi terbaiknya digarisbawahi.
Tingkat Dua
Selanjutnya kita
menentukan apakah ada Nash Equilibrium dengan memeriksa terjadinya strategi
optimal yang diidentifikasi sebelumnya. Jika semua imbalan dalam sel
digarisbawahi maka sel tersebut sesuai dengan ekuilibrium Nash. Ini benar
menurut definisi, karena dalam kesetimbangan Nash semua pemain memainkan
strategi optimal mereka mengingat bahwa pemain lain juga memainkan strategi
optimal mereka. Dalam permainan dilema tahanan hanya satu sel yang semua
elemennya digarisbawahi. Ini sesuai dengan kedua narapidana mengaku, dan jadi
ini adalah equilibrium Nash yang unik untuk game ini.
C.
Mixed Strategy Nash Equilibrium
Untuk mengilustrasikan
bahwa mungkin ada beberapa kesamaan Nash dengan permainan tertentu, dan juga
ide strategi campuran, kita melihat permainan klasik lain yang disebut
"Battle of the Sexes". Dalam permainan ini seorang suami dan istri
sedang mencoba memutuskan ke mana harus pergi untuk keluar malam. Sementara
mereka harus memilih untuk pergi ke pertandingan tinju, atau ke balet. Kedua
pemain lebih suka pergi ke mana saja bersama-sama, tetapi mengingat ini pria
lebih memilih tinju dan wanita balet. (Permainan ini diusulkan pada tahun
1950-an, yang sebagian menjelaskan pandangan stereotipnya). Preferensi ini
direpresentasikan dalam permainan bentuk normal yang ditunjukkan pada gambar
dibawah.
Menerapkan metode
dua tahap untuk mengidentifikasi strategi kesetimbangan Nash murni kita dapat
melihat bahwa permainan di atas memiliki dua kesetimbangan seperti itu. Keduanya
akan pergi ke tinju atau keduanya akan pergi ke balet. Setiap orang akan pergi
ke mana pun mereka berpikir orang lain akan pergi. Ini tidak terlalu membantu,
karena tidak memberitahu pemain apa yang mungkin dilakukan orang lain. Karena
tidak ada strategi murni yang unik, Nash tidak memiliki pemain yang dapat dengan
yakin memprediksi apa yang akan dilakukan orang lain. Bermain strategi campuran
adalah respons terhadap ketidakpastian ini. Strategi campuran adalah ketika
pemain mengacak beberapa atau semua strategi murni yang tersedia. Ini berarti
bahwa pemain menempatkan distribusi probabilitas atas strategi alternatif
mereka. Ekuilibrium strategi campuran adalah di mana setidaknya satu pemain
memainkan strategi campuran dan tidak ada yang memiliki insentif untuk
menyimpang secara sepihak dari posisi itu.
Kunci dari
strategi campuran Nash equilibrium adalah bahwa setiap strategi murni yang
dimainkan sebagai bagian dari strategi campuran memiliki nilai yang diharapkan
sama. Jika ini tidak benar, seorang pemain akan memainkan strategi yang
menghasilkan nilai tertinggi yang diharapkan untuk mengesampingkan semua yang
lain. Ini berarti situasi awal tidak bisa menjadi keseimbangan. Di sini kita
menunjukkan bagaimana mengidentifikasi strategi campuran Nash keseimbangan
untuk pertempuran permainan jenis kelamin.
Biarkan pr
(tinju) H adalah probabilitas bahwa suami pergi ke pertandingan tinju, dan pr
(tinju) W probabilitas bahwa istri pergi ke pertandingan tinju. Sama halnya
dengan pr (balet) H adalah probabilitas bahwa pria pergi ke balet, dan pr
(balet) W probabilitas bahwa wanita pergi ke balet. Karena ini adalah
satu-satunya dua alternatif, harus benar bahwa pr (tinju) + pr (balet) = 1
untuk suami dan istri. Mengingat probabilitas ini kita dapat menghitung nilai
yang diharapkan dari setiap tindakan yang mungkin dilakukan oleh setiap orang.
Dari permainan
bentuk normal, nilai pembayaran yang diharapkan untuk istri jika dia memilih
untuk pergi ke pertandingan tinju diberikan sebagai
Demikian pula nilai
hasil yang diharapkan jika dia pergi ke balet adalah EV
Dalam ekuilibrium,
nilai yang diharapkan dari kedua strategi ini harus sama dan kita dapatkan
Dalam strategi
campuran keseimbangan suami akan pergi ke balet dengan probabilitas 1/3 dan
tinju dengan probabilitas 2/3. Kita dapat melakukan perhitungan yang sama untuk
hasil yang diharapkan suami dan mendapatkan hasil yang sama bahwa dalam
kesetimbangan istrinya akan pergi ke balet dengan probabilitas 2/3 dan tinju dengan
probabilitas 1/3. Dengan probabilitas individu ini kita dapat menghitung bahwa
keduanya akan pergi ke tinju dengan probabilitas 2/9, keduanya pergi ke balet
dengan probabilitas 2/9, dan pergi ke acara terpisah dengan probabilitas 5/9.
Sumber:
0 komentar: