Oleh Dini Turipanam Alamanda

Hai shareaddict pecinta Teori Permainan di Indonesia, senang rasanya bisa menuliskan pemahaman pribadi mengenai konsep-konsep Teori Permainan yang sudah populer. Selamat membaca yah.

Teori permainan, ilmu pengambilan keputusan stategis merupakan kesatuan disiplin ilmu yang berbeda, yaitu gabungan ilmu matematika, psikologi dan filsafat. Teori permainan ditemukan dan dikembangkan pertama kali pada tahun 1944 oleh John Von Neumann dan Oskar Mongenstern, tapi mungkin saja ditemukan sebelumnya namun tidak terekam siapa penemunya. Pentingnya ilmu teori permainan untuk analisis modern dan pengambilan keputusan dibuktikan dengan peraihan nobel  kepada 12 ekonom dan ilmuwan terkemuka yang berkontribusi dalam pengembangan teori permainan.

Teori permainan telah diterapkan dalam banyak bisnis, keuangan, ekonomi, ilmu politik, psikologi dan bidang ilmu lainnya.  Memahami strategi permainan yang populer dianggap penting untuk meningkatkan penalaran dan keterampilan pengambilan keputusan seseorang di kehidupan yang kompleks ini.

Dilema Narapidana (Prisoner’s Dilemma)

Salah satu konsep teori permainan yang paling populer dan merupakan dasar teori ini adalah Dilema Narapidana. Konsep permainan ini lebih kepada mengeksplorasi strategi pengambilan keputusan yang diambil oleh dua pihak yang bergerak dan bertindak sesuai dengan kepentingan masing-masing pihak, bekerja sama satu sama lain akan lebih menguntungkan ketimbang dengan bergerak sendiri-sendiri.

Ilustrasi dilema narapidana adalah sebagai berikut: dua tersangka ditangkap ketika sedang melakukan kejahatan, mereka lalu ditahan di ruangan terpisah dimana mereka tidak dapat berkomunikasi satu sama lain. Jaksa menginformasikan bahwa masing-masing tersangka akan dipanggil satu per satu secara terpisah. Jika dalam panggilan tersebut tersangka pertama bersaksi melawan tersangka 2, bahwa tersangka 2 lah yang melakukan kejahatan, maka tersangka 1 bisa bebas. Sebaliknya, jika tersangka 1 dicurigai melakukan kejahatan dan mengaku sedangkan tersangka 2 tidak mengakui kejahatan, maka tersangka 1akan dijatuhi hukuman penjara 3 tahun.  Jika kedua tersangka mengakui kejahatan, masing-masing tersangka akan mendapatkan hukuman 2 tahun penjara. Namun jika keduanya tidak ada yang mengaku, keduanya akan dijatuhi hukuman satu tahun penjara saja.

 Matriks Imbalan

Dilema Narapidana

Tersangka 2

Mengaku Tidak Mengaku
 

Tersangka  1

Mengaku (a) 2, 2 (b) 0,3
Tidak Mengaku (b) 3,0 (d) 1, 1

Jika dilihat dari konsep dilema narapidana, kerja sama adalah strategi terbaik untuk kedua tersangka. Ketika dihadapkan pada kasus seperti itu, orang rasional lebih memilih untuk bersaksi melawan orang lain daripada tetap diam dan menjadi tertuduh sendiri karena kesempatan yang dia punya sudah di klaim lawan.

Strategi Teori Permainan

Dilema Narapidana meletakkan dasar strategi teori permainan tingkat tinggi populer lainnya, antara lain:

Matching Pennies:  merupakan jenis permainan zero-sum (zero-sum game) yang melibatkan dua pemain (sebut saja Pemain 1 dan Pemain 2) secara bersamaan melempar uang koin di atas meja. Jika kedua koin yang terlihat adalah kepala atau ekor, maka Pemain 1 menang dan bisa menyimpan uang koin Pemain 2. Jika koin yang dilempar memperlihatkan dua sisi yang berbeda, maka Pemain 2 menang dan bisa menyimpan uang koin Pemain 1.

Deadlock: Permainan ini termasuk jenis skenario dilema sosial. Seperti halnya dilema narapidana, kedua pemain bisa memilih bekerja sama atau tidak bekerja sama. Dalam deadlock, jika kedua pemain bekerja sama, keduanya akan mendapatkan imbalan (payoff) sebesar 1, jika sebaliknya, keduanya akan mendapatkan imbalan sebesar 2. Jika Pemain 1 memilih bekerja sama dan Pemain 2 memilih berkhianat, maka Pemain 1 akan mendapatkan imbalan 0 dan Pemain 2 akan mendapatkan poin 3.

Matriks Imbalan Deadlock

Pemain 2

Kerja sama Berkhianat
 Pemain 1 Kerja sama (a) 1,1 (b) 0,3
Berkhianat (b) 3,0 (d) 2,2

Perbedaan deadlock dengan dilema narapidana adalah tindakan saling menguntungkan yang terbesar adalah ketika kedua pemain saling berkhianat, dan itu menjadi strategi yang dominan. Strategi dominan adalah strategi yang menghasilkan imbalan tertinggi dari strategi yang tersedia, terlepas dari strategi yang digunakan oleh pemain lainnya atau tidak.

Contoh umum permainan deadlock adalah perang nuklir, dua kekuatan (negara) berusaha mencapai kesepakatan untuk menghapus persenjataan nuklir yang mereka punya. Dalam contoh ini, kerja sama artinya mengikuti kesepakatan, sementara pengkhianatan artinya secara diam-diam mengingkari kesepakatan dan mempertahankan persenjataan nuklirnya. Hasil terbaik untuk kedua negara adalah ketika mereka saling membelot dan mempertahankan opsi untuk menyimpan senjata nuklirnya, karena hal itu lebih baik daripada jika memberikan kesempatan kekuatan lain untuk curang dan melempar nuklir ke negaranya.

Kompetisi Cournot (Cournot Competition): Model ini juga secara konseptual mirip dengan Dilema Narapidana, yang namanya diambil dari penemunya yaitu Augustin Cournot pada tahun 1838. Penerapan model Cournot umumnya digunakan pada ilmu ekonomi dalam mendeskripsikan pasar duopoli. Pasar duopoli yaitu pasar di mana penawaran suatu barang dikuasai oleh dua perusahaan.

 Matriks Imbalan Cournot

Pemain T

Skala kecil Skala besar
Pemain C Skala kecil (a) 4,4 (b) 0,7
Skala besar (b) 7,0 (d) 2,2

Contohnya: Terdapat dua perusahaan, Perusahaan C dan T yang menghasilkan produk identik dan bisa menghasilkan produk dalam jumlah besar maupun jumlah kecil. Jika kedua perusahaan bekerja sama dan sepakat untuk berproduksi skala kecil, maka persediaan barang di pasaran akan sedikit sehingga kedua perusahaan bisa mematok harga tinggi dan mengambil keuntungan yang besar. Di sisi lain adalah jika kedua perusahaan memilih untuk memproduksi barang dalam skala besar, akibatnya barang yang beredar sangat banyak dipasaran, dan harga produkpun akan menjadi rendah sehingga kedua perusahaan mempunyai keuntungan yang sedikit. Kondisi lainnya adalah, ketika perusahaan C tetap memproduksi produk dalam skala kecil dan perusahaan T memproduksi produk dalam skala besar. Yang mungkin terjadi adalah, perusahaan T akan sangat diuntungkan, lebih besar keuntungannya daripada saat kedua perusahaan melakukan kesepakatan. Sedangkan untuk perusahaan C, mendapatkan hasil impas (Break Event Point/ BEP) saja sudah lebih baik daripada harus sampai gulung tikar.

Koordinasi: Dalam koordinasi, para pemain mendapatkan imbalan lebih tinggi ketika mereka memilih tindakan yang sama. Sebagai contoh, dua perusahaan IT bermaksud memperkenalkan teknologi baru dalam sebuah chip memori yang bisa menghasilkan keuntungan yang sangat besar atau opsi lainnya adalah perusahaan bisa meluncurkan teknologi lama dengan sentuhan revisi. Jika hanya satu perusahaan saja yang mengadopsi teknologi baru, penerimaan pasar oleh konsumen akan lebih sedikit dibandingkan jika kedua perusahaan mengadopsi teknologi baru bersama-sama. Perhatikan mariks berikut ini:

 Matriks Imbalan Koordinasi

Pemain B

Teknologi baru Teknologi lama
Pemain A Teknologi baru (a) 600, 600 (b) 0, 150
Teknologi lama (b) 150, 0 (d) 300, 300

Begini strateginya, jika kedua perusahaan memutuskan untuk memperkenalkan teknologi baru, masing-masing akan memperoleh keuntungan 600 milyar rupiah, jika hanya memperkenalkan versi revisi dari teknologi lama, keuntungannya hanya sebesar 300 milyar rupiah untuk masing-masing perusahaan. Tetapi jika hanya satu perusahaan saja yang memperkenalkan teknologi baru, perusahaan tersebut hanya akan memperoleh 150 milyar rupiah walaupun perusahaan lainnya tidak mendapatkan keuntungan sama sekali. Dalam kasus ini, hal yang paling rasional untuk dilakukan adalah bekerja sama memperkenalkan teknologi baru.

Permainan Lipan (Centipede Game): permainan ini merupakan jenis ekstensif dimana dua pemain secara bergantian mendapatkan kesempatan untuk mengambil keuntungan yang lebih besar secara perlahan. Permainan lipan sifatnya sekuensial (berurutan) dimana pemain bergerak satu per satu seperti bermain catur, bukan bersamaan seperti dalam lelang. Setiap pemainpun mengetahui strategi yang dipilih oleh pemain lainnya. Permainan ini berakhir hingga salah satu pemain mendapatkan keuntungan yang lebih besar daripada lawannya.

Sebagai contoh, misalkan terdapat dua orang pemain yaitu Pemain C dan T. Pemain C mendapatkan kesempatan melangkah pertama untuk melakukan aksi  menekan tombol “TAKE” atau “PASS” yang saat ini jumlah simpanannya masing-masing adalah 2. Jika Pemain C melakukan aksi “TAKE”, maka Pemain C dan T akan mendapatkan masing-masing nilai 1, tetapi jika Pemain C menekan tombol “PASS”, maka permainan berikutnya diambil alih oleh Pemain T. Lanjutannya, jika Pemain T mengambil posisi “TAKE”, dia akan mendapatkan nilai 3 (akumulasi simpanan sebelumnya, 2 + 1) dan Pemain C mendapatkan 0. Tetapi jika Pemain T menekan tombol “PASS”, maka permainan berikutnya diambil oleh Pemain C, dan seterusnya. Jika kedua pemain selalu memilih untuk “PASS”, masing-masing akan mendapatkan nilai 100 di akhir permainan.

Inti dari permainan ini adalah, jika Pemain C dan T selalu bekerja sama melakukan aksi “PASS” hingga akhir permainan, masing-masing akan mendapatkan imbalan sebesar 100. Tetapi jika mereka tidak mempercayai lawannya dan melakukan aksi “TAKE” pada kesempatan pertama, maka menurut Hukum Ekuilibrium Nash, pemain akan mengambil klaim serendah mungkin yaitu 1. Dalam sebuah eksperiman yang dilakukan oleh para ahli, hasil menunjukan bahwa perilaku “rasional” seperti ini sangat jarang ditemui dalam kehidupan nyata. Hal tersebut tidak mengejukan mengingat secara intuisi sekecil apapun imbalan yang diperoleh akan berdampak pada hasil akhirnya. Perilaku serupa juga ditunjukkan dalam dilema traveler berikut ini.

Dilema Traveler: Permainan ini termasuk kedalam jenis permainan non-zero (non-zero sum game), dimana dua pemain berusaha untuk memaksimalkan hasil mereka pribadi tanpa memperdulikan perolehan lawan. Permainan ini disusun dan dipopulerkan oleh seorang ekonom bernama Kaushik Basu pada tahun 1994.

Contoh yang paling menarik adalah kasus kehilangan barang di pesawat. Sebuah perusahaan penerbangan setuju untuk memberikan kompensasi bagi dua penumpang yang menjadi korban kehilangan barang dan barang hilang tersebut bersifat identik.

Selanjutnya, secara terpisah, kedua penumpang pesawat tersebut diminta untuk memperkirakan nilai barang yang hilang dengan minimum harga 2 juta rupiah dan maksimal 100 juta rupiah. Jika keduanya menuliskan nilai yang sama, maka maskapai penerbangan tersebut akan mengganti masing-masing sejumlah nilai yang dituliskan oleh kedua penumpang. Tetapi jika nilainya berbeda, maskapai penerbangan akan memberikan kompensasi 2 juta rupiah bagi yang menuliskan nilai rendah, dan menarik denda 2 juta rupiah bagi yang menuliskan nilai yang lebih tinggi.

Dalam hukum ekulibrium Nash, berdasarkan langkah sebelumnya (induksi ke belakang), maka nilai 2 juta rupiah akan terpilih. Tetapi jika menggunakan konsep permainan lipan, hasil percobaan menunjukkan bahwa mayoritas penumpang akan secara naif memilih nilai yang lebih besar dari 2. Dilema Traveler dapat diterapkan untuk menganalisa berbagai situasi kehidupan nyata. Proses induksi ke belakang dapat membantu menjelaskan bagaimana dua perusahaan yang terlibat dalam kompetisi bisnis yang ketat dapat dengan mantap menurunkan harga produk serendah-rendahnya untuk mendapatkan pangsa pasar, yang dapat menyebabkannya timbulnya kerugian yang semakin besar dalam prosesnya.

Battle of the Sexes: Permainan ini merupakan bentuk lain dari permainan koordinasi yang dipaparkan sebelumnya namun dengan metode pembayaran berbeda yaitu bersifat asimetri. Permainan ini melibatkan pasangan kekasih yang mencoba untuk mendiskusikan acara makan malam romantis mereka. Si pria menginginkan pertemuan disebuah klub futsal sementara si wanita menginginkan pertemuan disebuah kafe yang dekat dengan salon kesukaannya. Kemanakah mereka seharusnya pergi? Matriks di bawah ini menunjukkan nilai yang didapatkan, yang mewakili tingkat kepuasan relatif baik untuk si pria maupun si wanita.

Matriks Imbalan

Battle of Sexes

Pria

Kafe Klub Futsal
Wanita Kafe (a) 6,3 (b) 2,2
Klub Futsal (b) 0,0 (d) 3,6

Contohnya, sel (a) mewakili nilai kepuasan baik untuk si pria maupun si wanita, pada sel ini si wanita, di kafe, lebih merasa puas dengan nilai kepuasan lebih besar dari si pria (6 vs 3). Sel (d) menunjukkan sebaliknya, dimana si pria, di klub futsal, lebih merasa puas ketimbang si wanita (3 vs 6). Sel (c) merepresentasikan ketidakpuasan pasangan tersebut tatkala mereka harus pergi ke tempat lain yang tidak menarik bagi keduanya. Dan sel (b) memperlihatkan tingkat kepuasan yang sepadan, jika pasangan tersebut memutuskan pergi ke tempat lain yang dianggap lumayan mewakili keinginan naik si pria maupun si wanita, misalnya mereka memutuskan bertemu di kafe yang dekat dengan salon dan klub futsal.

Permainan diktator: Ini adalah permainan sederhana dimana Pemain A harus memutuskan bagaimana membagi hadiah uang tunai dengan Pemain B, yang tidak mengadopsi pilihan Pemain A. Eksperimen menunjukkan bahwa sekitar 50% pemain A akan menyimpan semua uang untuk dirinya sendiri, 5% membagi sama rata dan 45% lainnya akan memberikan kepada Pemain B porsi yang lebih sedikit. Permainan diktator ini mirip dengan permainan ultimatum, dimana Pemain A diberi sejumlah uang tertentu, yang bagiannya harus diberikan pada Pemain B. Pemain B bisa melakukan aksi menerima atau menolak tawaran nilai tersebut, dan jika Pemain B menolak, maka Pemain A pun tidak akan mendapatkan bagian yang dijanjikan. Kedua permainan memberikan pelajaran penting agar kita sebagai manusia lebih banyak menjadi filantropi atau rajin bersedekah daripada meributkan pembagian hasil yang memusingkan kepala.

Damai-Perang: Sebuah variasi dari permainan Dilema Narapidana dimana keputusan “Bekerja Sama atau Berkhianat” digantikan dengan istilah “Damai atau Perang.” Contohnya adalah ketika dua perusahaan terlibat dalam perang harga. Jika keduanya menahan diri dari aksi pemotongan harga, keduanya akan lebih bisa menikmati keuntungan relatif (lihat sel a), jika perang harga terus digencarkan, hal tersebut akan mengurangi keuntungan secara drastis bagi keduanya. Jika perusahaan 1 melakukan pemotongan harga dan perusahaan 2 sebaliknya, Perusahaan 1 akan menghasilkan keuntungan yang lebih besar dengan skor 4 karena menghasilkan pangsa pasar yang lebih luas sehingga volume yang dijual pun lebih banyak untuk mengimbangi harga yang dijual lebih rendah dari pesaing. Begitupula sebaliknya.

Matriks Imbalan

Damai – Perang

Perusahaan 2

Damai Perang
 Perusahaan 1 Damai (a) 3,3 (b) 0,4
Perang (b) 4,0 (d) 1,1

Dilema Relawan: Dalam konsep ini, seseorang harus melakukan tugas atau pekerjaan demi kebaikan bersama. Contoh menariknya adalah dalam kasus korupsi besar-besaran dalam sebuah instansi yang dilakukan oleh banyak karyawannya namun tidak disadari oleh manajemen puncaknya. Seorang karyawan junior yang tidak korupsi takut untuk melaporkan kecurangan seniornya pada manajemen puncak karena akan berbahaya bagi karirnya dan akan di cap sebagai “whistleblower” panggilan yang sangat tidak mengenakkan. Tetapi jika si sukarelawan dalam hal ini karyawan junior tadi tidak melaporkan, maka kecurangan akan semakin merajalela dan membahayakan nasib instansi dimasa depan, bisa bangkrut dan semua orang menjadi kehilangan pekerjaan.

Semoga tulisan saya di atas lebih bisa memberikan gambaran yah, bukan malah lebih memperkeruh sajian konsep yang sudah ada. ^ ^