[TULISAN] Teknik Solusi Teori Game Statis

07.26.00 Unknown 0 Comments


Techniques for Solving & Weak Dominance, Nash Equilibrium, dan Mixed Strategy Nash Equilibrium

      A.   Techniques for Solving and Weak Dominance
Solusi untuk permainan adalah prediksi tentang apa yang akan dilakukan oleh setiap pemain dalam permainan itu. Ini mungkin merupakan prediksi yang sangat tepat, di mana solusi memberikan satu strategi optimal untuk setiap pemain. Ketika ini terjadi, solusinya dikatakan unik. Namun, sering terjadi bahwa solusi untuk permainan tertentu kurang tepat, bahkan sejauh tidak ada strategi yang tersedia yang dikesampingkan. Seperti yang diharapkan banyak teknik solusi yang berbeda telah diusulkan untuk berbagai jenis permainan.
Untuk permainan statis, dua teknik solusi telah diterapkan. Set pertama teknik solusi mengandalkan konsep dominasi. Solusi ini untuk permainan ditentukan dengan mencoba untuk mengesampingkan strategi manusia yang rasional tidak akan pernah dimainkan. Argumen berdasarkan dominasi berusaha untuk menjawab pertanyaan "Strategi apa yang akan pemain rasional tidak pernah dimainkan?" Set kedua teknik solusi didasarkan pada konsep kesetimbangan. Dalam permainan non-kooperatif keseimbangan terjadi ketika tidak ada pemain, bertindak secara individual, memiliki insentif untuk menyimpang dari solusi yang diprediksi. Dengan teknik solusi ini, sebuah permainan diselesaikan dengan menjawab pertanyaan “Properti apa yang perlu agar menjadi solusi keseimbangan?”.
Pada bagian berikut ini kita memeriksa berbagai teknik dominan yang dapat diterapkan untuk permainan statis, dan dua konsep kesetimbangan.
a.       Strict Dominance
Sebuah strategi dikatakan dominasi secara ketat jika strategi lain selalu memberikan hasil yang lebih baik apa pun yang dilakukan pemain lain dalam permainan. Teknik solusi ini membuat asumsi yang masuk akal bahwa seorang pemain rasional tidak akan pernah memainkan strategi yang benar-benar didominasi. Jika seorang pemain dengan sengaja memainkan strategi yang sangat didominasi, mereka tidak dapat memaksimalkan hasil yang mereka harapkan, mengingat keyakinan mereka tentang apa yang akan dilakukan pemain lain.
Untuk mengilustrasikan teknik ini, kita menggunakannya untuk memecahkan permainan dilema tahanan. Dalam menerapkan prinsip strict dominanace, kita memeriksa setiap pemain secara bergantian dan mengecualikan semua strategi yang benar-benar didominasi. Proses ini mungkin mengesampingkan semua kecuali satu strategi untuk setiap pemain. Ini berlaku untuk game dilema tahanan, dan teknik ini menghasilkan solusi unik untuk game ini.
Pertimbangkan pertama dilema yang dihadapi tahanan 1. Haruskah dia mengaku atau haruskah dia tetap diam berharap tahanan lain melakukan hal yang sama. Prinsip strict dominance berpendapat bahwa tahanan 1 harus mengaku. Alasannya adalah bahwa tahanan apa pun yang memutuskan untuk melakukan tahanan 1 selalu lebih baik mengaku. Ini berarti tidak mengaku benar-benar didominasi dan tampaknya masuk akal untuk menganggapnya tidak akan dimainkan. Logika yang sama berlaku sama untuk narapidana 2 dan dominasi yang begitu ketat meramalkan bahwa ia juga akan mengaku. Solusi untuk permainan ini berdasarkan strict dominance adalah bahwa kedua tahanan mengaku meskipun keduanya akan lebih baik jika tidak mengaku. Setidaknya salah satu pemain dalam permainan ini dapat, dengan hasil yang berbeda, dibuat lebih baik tanpa pemain lain yang dibuat lebih buruk dari solusi ini dikatakan tidak efisien (kenyataannya jika kedua pemain tidak mengakui keduanya akan lebih baik).

b.      Weak Dominance
Suatu strategi dikatakan weak dominance jika strategi lain membuat orang itu lebih baik dalam beberapa situasi dan membuat mereka tidak peduli pada yang lain. Sekali lagi, tampaknya masuk akal untuk mengasumsikan bahwa seorang pemain rasional tidak akan memainkan strategi yang didominasi lemah, dan mungkin bahkan lebih baik, dengan memainkan strategi dominan. Pertimbangkan permainan bentuk normal yang ditunjukkan pada gambar dibawah.
Dalam game ini ada dua pemain masing-masing dengan dua kemungkinan strategi. Pemain 1 dapat bergerak "naik" atau "turun", dan pemain 2 dapat bergerak "kiri" atau "kanan". Hasil diberikan dalam matriks, di mana angka pertama adalah bayaran untuk pemain 1 dan angka kedua adalah hasil untuk pemain 2. Untuk permainan ini tidak ada strategi yang tersedia dikesampingkan menggunakan prinsip dominasi ketat. Ini karena tidak ada strategi yang membuat pemain itu semakin buruk dalam semua keadaan. Sebagai contoh, jika pemain 1 memainkan "naik" maka pemain 2 adalah acuh tak acuh antara "kiri" dan "kanan". Demikian pula jika pemain 2 memainkan "kiri" pemain 1 adalah acuh tak acuh antara "atas" dan "bawah".

     B.   Nash Equilibrium
Nash Equilibrium yang dimotivasi oleh pertanyaan" Sifat apa yang harus dimiliki ekuilibrium? Jawaban untuk pertanyaan ini dari John Nash (1951), berdasarkan pada karya sebelumnya oleh Cournot (1838), adalah bahwa dalam ekuilibrium setiap strategi yang dipilih pemain adalah optimal mengingat setiap pemain lain memilih strategi kesetimbangan. Jika ini tidak terjadi maka setidaknya satu pemain akan ingin memilih strategi yang berbeda dan jadi kita tidak bisa berada dalam kesetimbangan. Sekali lagi konsep ini berusaha untuk menerapkan asumsi ekonom bahwa individu bersifat rasional dalam arti bahwa mereka berusaha untuk memaksimalkan kepentingan diri mereka sendiri.
Menemukan Nash Equilibrium untuk permainan apa pun melibatkan dua tahap. Pertama, kita mengidentifikasi strategi optimal setiap pemain sebagai reaksi terhadap apa yang mungkin dilakukan pemain lain. Ini melibatkan bekerja melalui setiap pemain secara bergantian dan menentukan strategi optimal mereka. Dilakukan untuk setiap kombinasi strategi oleh pemain lain. Kedua, Nash Equilibrium diidentifikasi ketika semua pemain memainkan strategi optimal mereka secara bersamaan.
Untuk mengilustrasikan metodologi dua tahap untuk menemukan keseimbangan (strategi murni) Nash, kita menerapkannya pada permainan dilema narapidana. Ini ditunjukkan pada gambar dibawah ini.
Tingkat Satu
Pertama-tama kita perlu mengidentifikasi strategi optimal untuk setiap tahanan, tergantung pada apa yang mungkin dilakukan tahanan lain. Jika tahanan 1 mengharapkan tahanan 2 untuk mengaku maka strategi terbaik narapidana 1 juga untuk mengaku (-6 lebih baik daripada -9). Dengan menggarisbawahi elemen pembayaran ini untuk napi 1 di sel yang sesuai dengan kedua narapidana mengaku. Jika tahanan 1 mengharapkan narapidana 2 tidak mengaku, maka strategi terbaik narapidana masih untuk mengaku (saat ini 0 lebih baik dari -1). Sekali lagi kita menunjukkan ini dengan menggarisbawahi elemen pembayaran ini untuk narapidana 1. Analisis yang sama dilakukan untuk napi 2 dan imbalan strategi terbaiknya digarisbawahi.

Tingkat Dua
Selanjutnya kita menentukan apakah ada Nash Equilibrium dengan memeriksa terjadinya strategi optimal yang diidentifikasi sebelumnya. Jika semua imbalan dalam sel digarisbawahi maka sel tersebut sesuai dengan ekuilibrium Nash. Ini benar menurut definisi, karena dalam kesetimbangan Nash semua pemain memainkan strategi optimal mereka mengingat bahwa pemain lain juga memainkan strategi optimal mereka. Dalam permainan dilema tahanan hanya satu sel yang semua elemennya digarisbawahi. Ini sesuai dengan kedua narapidana mengaku, dan jadi ini adalah equilibrium Nash yang unik untuk game ini.

     C.   Mixed Strategy Nash Equilibrium
Untuk mengilustrasikan bahwa mungkin ada beberapa kesamaan Nash dengan permainan tertentu, dan juga ide strategi campuran, kita melihat permainan klasik lain yang disebut "Battle of the Sexes". Dalam permainan ini seorang suami dan istri sedang mencoba memutuskan ke mana harus pergi untuk keluar malam. Sementara mereka harus memilih untuk pergi ke pertandingan tinju, atau ke balet. Kedua pemain lebih suka pergi ke mana saja bersama-sama, tetapi mengingat ini pria lebih memilih tinju dan wanita balet. (Permainan ini diusulkan pada tahun 1950-an, yang sebagian menjelaskan pandangan stereotipnya). Preferensi ini direpresentasikan dalam permainan bentuk normal yang ditunjukkan pada gambar dibawah.

Menerapkan metode dua tahap untuk mengidentifikasi strategi kesetimbangan Nash murni kita dapat melihat bahwa permainan di atas memiliki dua kesetimbangan seperti itu. Keduanya akan pergi ke tinju atau keduanya akan pergi ke balet. Setiap orang akan pergi ke mana pun mereka berpikir orang lain akan pergi. Ini tidak terlalu membantu, karena tidak memberitahu pemain apa yang mungkin dilakukan orang lain. Karena tidak ada strategi murni yang unik, Nash tidak memiliki pemain yang dapat dengan yakin memprediksi apa yang akan dilakukan orang lain. Bermain strategi campuran adalah respons terhadap ketidakpastian ini. Strategi campuran adalah ketika pemain mengacak beberapa atau semua strategi murni yang tersedia. Ini berarti bahwa pemain menempatkan distribusi probabilitas atas strategi alternatif mereka. Ekuilibrium strategi campuran adalah di mana setidaknya satu pemain memainkan strategi campuran dan tidak ada yang memiliki insentif untuk menyimpang secara sepihak dari posisi itu.
Kunci dari strategi campuran Nash equilibrium adalah bahwa setiap strategi murni yang dimainkan sebagai bagian dari strategi campuran memiliki nilai yang diharapkan sama. Jika ini tidak benar, seorang pemain akan memainkan strategi yang menghasilkan nilai tertinggi yang diharapkan untuk mengesampingkan semua yang lain. Ini berarti situasi awal tidak bisa menjadi keseimbangan. Di sini kita menunjukkan bagaimana mengidentifikasi strategi campuran Nash keseimbangan untuk pertempuran permainan jenis kelamin.
Biarkan pr (tinju) H adalah probabilitas bahwa suami pergi ke pertandingan tinju, dan pr (tinju) W probabilitas bahwa istri pergi ke pertandingan tinju. Sama halnya dengan pr (balet) H adalah probabilitas bahwa pria pergi ke balet, dan pr (balet) W probabilitas bahwa wanita pergi ke balet. Karena ini adalah satu-satunya dua alternatif, harus benar bahwa pr (tinju) + pr (balet) = 1 untuk suami dan istri. Mengingat probabilitas ini kita dapat menghitung nilai yang diharapkan dari setiap tindakan yang mungkin dilakukan oleh setiap orang.
Dari permainan bentuk normal, nilai pembayaran yang diharapkan untuk istri jika dia memilih untuk pergi ke pertandingan tinju diberikan sebagai

Demikian pula nilai hasil yang diharapkan jika dia pergi ke balet adalah EV

Dalam ekuilibrium, nilai yang diharapkan dari kedua strategi ini harus sama dan kita dapatkan

Dalam strategi campuran keseimbangan suami akan pergi ke balet dengan probabilitas 1/3 dan tinju dengan probabilitas 2/3. Kita dapat melakukan perhitungan yang sama untuk hasil yang diharapkan suami dan mendapatkan hasil yang sama bahwa dalam kesetimbangan istrinya akan pergi ke balet dengan probabilitas 2/3 dan tinju dengan probabilitas 1/3. Dengan probabilitas individu ini kita dapat menghitung bahwa keduanya akan pergi ke tinju dengan probabilitas 2/9, keduanya pergi ke balet dengan probabilitas 2/9, dan pergi ke acara terpisah dengan probabilitas 5/9.


Sumber:



0 komentar: