Minggu, 02 Maret 2008

Game Theory dan Dilema Narapidana

Game theory sebenarnya adalah cabang matematika terapan yang sering dipakai dalam konteks ekonomi. Teori ini mempelajari interaksi strategis antar pemain (“agen”). Dalam permainan strategis, suatu agen memilih strategi yang dapat memaksimalkan keuntungan, berdasarkan strategi yang dipilih agen lain. Intinya, teori ini menyediakan pendekatan permodelan formal terhadap situasi sosial mengenai bagaimana pelaku keputusan berinteraksi dengan agen lain.

Game theory dapat menjelaskan suatu paradoks yang cukup terkenal, yakni bagaimana orang bisa bekerjasama dalam masyarakat apabila masing-masing dari mereka cenderung berusaha untuk menjadi pemenang. Asal tahu saja, paradoks ini sempat menyusahkan Charles Darwin saat menyusun teori evolusinya itu. (Dan dengan demikian mematahkan satu lagi argumen bahwa teori evolusi tidak dapat dibuktikan secara matematis).

Para ekonom dibikin kagum dengan game theory karena teori ini dapat menjelaskan secara matematis mengapa tangan yang tak terlihat (invisible hand) yang diajukan oleh pelopor pasar bebas Adam Smith, bisa gagal memberikan kemaslahatan umum. John Nash, matematikawan yang juga dikenal sebagai salah seorang pelopor game theory menunjukkan perbedaan antara permainan kooperatif, dimana masing-masing pemain saling bekerjasama secara terikat, dan permainan non-kooperatif, dimana tidak ada kekuatan dari luar permainan yang dapat memaksakan berlakunya sekumpulan peraturan yang sudah ditentukan sebelumnya.

Dalam permainan non-kooperatif, Nash menemukan bahwa jika harapan semua pemain terpenuhi, mereka tidak akan mau mengubah strategi karena mereka akan rugi sendiri. Hasilnya adalah suatu kesetimbangan (equilibrium), yang sekarang disebut sebagai Kesetimbangan Nash. Walaupun pernah frustrasi sampai sakit jiwa akibat gagal memperoleh medali Field (penghargaan prestisius untuk bidang Matematika), tapi Nash akhirnya berhasil meraih Nobel Ekonomi berkat teorinya ini.

Karya ini bisa menerangi keputusan-keputusan bisnis dalam pasar yang penuh persaingan, teori makroekonomi untuk kebijakan ekonomi, ekonomi lingkungan dan sumberdaya, teori perdagangan luar negeri, ekonomi informasi, dan seterusnya. Para politisi juga pasti menyukai teori ini karena bisa menunjukkan bagaimana kepentingan pribadi yang “rasional” bisa merugikan semua orang. Pada 1970-an, game theory diperluas hingga mencakup bidang biologi. Sekarang kita lihat, bagaimana game theory berperan dalam teori evolusi.

Untuk itu, kita perlu berkenalan dulu dengan yang namanya dilema narapidana (prisoner’s dilemma). Ini adalah istilah untuk menggambarkan interaksi, entah antara individu-individu atau kelompok-kelompok dalam bentuk suatu permainan sederhana. Gagasan permainannya adalah untuk menirukan konflik-konflik yang ada dalam dunia nyata, antara pandangan pemenang memperoleh segalanya, dan perlunya kerjasama dan kompromi untuk memperoleh semuanya itu.

Berikut adalah skenario dasar dari dilema narapidana. Dua narapidana (napi) diketahui telah melakukan jenis kejahatan X. Tetapi, polisi menduga mereka telah melakukan suatu jenis kejahatan Y yang lebih serius. Kedua napi lantas ditempatkan dalam sel terpisah dan masing-masing diberikan tawaran:

Napi yang bersaksi melawan napi yang lainnya terkait dengan kejahatan Y akan dibebaskan, sementara napi lainnya akan dipenjara selama 3 tahun. Ini disebut ”sucker’s payoff” (entah apa terjemahannya dalam bahasa Indonesia).
Apabila keduanya menyangkal, atau saling bersaksi terhadap yang lainnya, maka keduanya akan mendapat hukuman 2 tahun penjara.
Apabila keduanya bungkam, maka masing-masing akan menjalani hukuman 1 tahun penjara.
Disini, kedua napi pada dasarnya mendapat dua pilihan: untuk bekerjasama (dalam skenario ini, tetap diam) atau untuk berkhianat. Bekerjasama artinya bahwa napi bersangkutan bisa jadi mendekam di penjara selama 1 atau 3 tahun. Tapi apabila berkhianat, maka ia dapat menjalani hukuman 0 atau 2 tahun, tergantung pengakuan napi lainnya.

Karena masing-masing napi tidak tahu pilihan apa yang diambil napi lainnya (keduanya berada dalam sel terpisah dan tidak dapat berkomunikasi satu sama lain), pilihan yang rasional, menurut aturan bertahan hidup ala Darwin adalah pilihan yang paling menguntungkan (ingat kaidah survival of the fittest). Dalam hal ini adalah memaksimalkan kemungkinan terbaik (nol tahun di penjara) dan meminimalisir kemungkinan terburuk (2 atau 3 tahun di penjara).

Tahun 1980-an, sebuah kompetisi pemrograman komputer diadakan untuk mencari solusi terbaik untuk dilema narapidana. Hasilnya, sebuah program simulasi yang dinamai Tit-for-tat keluar sebagai pemenang. Seperti yang ditunjukkan oleh namanya (yang secara harafiah berarti satu pukulan dibalas satu pukulan), program ini memilih bekerjasama pada putaran pertama, dan kemudian menirukan apapun yang dilakukan lawan pada putaran-putaran selanjutnya.

Dalam kasus ini, saling bekerjasama membawa hasil positif, sementara si pengkhianat kelak akan memperoleh balasannya (apabila Anda mengkhianati saya, pada putaran berikut Anda juga akan saya khianati). Sebaliknya, kalau kita bekerjasama, tidak perduli apapun yang dilakukan orang lain, akibatnya adalah “suckers payoff.” Orang lain tidak punya insentif untuk bekerjasama dengan kita, dan akibatnya kita akan selalu menjadi pecundang.

Tapi, itu kan dalam simulasi. Dalam dunia nyata, si baik bisa saja merugi, dan si pengkhiat bisa beruntung, dan kadang-kadang memang demikian yang terjadi. Kemunculan kerjasama dapat dipicu manakala salahsatu diantara kondisi-kondisi berikut ini ada: para ‘pemain’ berkali-kali saling bertemu; mereka saling mengenal; mereka mengingat hasil pertemuan terdahulu. Tapi ada juga faktor-faktor lain yang juga perlu diperhitungkan, mulai dari peluang terjadinya pertemuan antar pemain, kesalahan-kesalahan (ketika ajakan untukk bekerjasama justeru dianggap sebagai pengkhianatan), hingga kemungkinan adanya faktor genetis pembentuk perilaku yang diwariskan dari generasi ke generasi. Dengan demikian, tit-for tat mungkin terlalu ideal sehingga sulit diterapkan di dunia nyata.

Solusinya adalah dengan menambahkan unsur kesalahan, yang mungkin hanya disebabkan kecenderungan manusiawi untuk berbuat kesalahan. Tit-for-tat bukanlah strategi paling hebat, karena tidak punya sifat pemaaf: sekali dua pemain tit-for-tat mulai saling berkhianat, mereka akan terus melakukan itu. Dengan menambahkan sedikit unsur ketidakpastian, masing-masing pemain dapat mengembangkan strategi baru. Penambahan sedikit unsur keacakan pada perilaku program memungkinkan munculnya “sifat pemaaf”, dan kesempatan untuk menguji perilaku pemain lain.

Satu strategi yang menggunakan sifat pemaaf adalah “tit-for-tat baik hati” (generous tit-for-tat), dimana ditambahkan unsur keacakan untuk memutuskan lingkaran setan saling mengkhianati. Strategi lain yang yang lebih sukses, diberi nama Pavlov, dapat digambarkan dengan ungkapan “Kalau tidak rusak, tak usah diperbaiki (dan jika Anda kalah, ganti strategi).” Bagaimanapun juga, ketidak pastian ternyata memungkinkan kerjasama, dan pesan optimistik dalam model tit-for-tat tetap berlaku.

Pendeknya, apa yang ditunjukkan oleh dilema narapidana juga dapat terjadi dalam tataran pribadi maupun evolusioner: Kalau saya bekerjasama dengan Anda, maka Anda kemungkinan besar juga akan bekerjasama dengan saya (strategi tit-for-tat) dan kita akan memperoleh skor yang sama dalam “permainan kehidupan”. Sebaliknya, apabila kita saling mengkhianati, maka kita berdua sama-sama kalah dan akhirnya “game over”.

http://blog.dhani.org/2007/09/game-theory-dan-dilema-narapidana/


0 komentar:

Posting Komentar