Game Theory 1 - Dosen Perbanas

Game theory adalah suatu studi mengenai model matematika yang menggambarkan adanya interaksi antara kedua pemain yang merupakan individu yang rasional, dimana terdapat interdependensi antara strategi-strategi pemain. Setiap strategi akan memberikan konsekuensi yang berbeda bagi pemain itu sendiri maupun pemain lainnya. Strategi yang optimal yang dipilih didasarkan pada ekspektasi pemain atas apa yang pemain lain lakukan. Pada prakteknya, game theory ini banyak digunakan sebagai sebagai metode pengambilan keputusan pada ilmu ekonomi, ilmu politik, dan psikologi.

Pada artikel Game Theory 1 ini, akan dijelaskan dasar dari Game Theory, yaitu elemen apa sajakah yang harus dipenuhi, dan bentuk-bentuk game theory.

Elemen Game Theory

Dalam game theory, terdapat beberapa elemen yang harus ada, yaitu:

Pemain

Pemain merupakan pihak-pihak (dapat merupakan individu ataupun organisasi) yang bertindak dalam pengambilan keputusan dalam suatu game. Setiap pemain mempunyai kemampuan untuk memilih sekumpulan aksi yang dilakukannya.

Peraturan

Dalam suatu game, harus terdapat peraturan yang menjelaskan pemain mana yang harus bermain, kapan pemain harus bermain, dan apa yang diketahui oleh pemain tersebut ketika bermain, dan aksi apa yang pemain lakukan.

Strategi

Strategi merupakan aksi yang dapat dilakukan oleh pemain. Stretegi optimal merupakan strategi yang memaksimalkan ekspektasi pay off pemain

Pay off

Setiap strategi yang diambil pemain akan memberikan konsekuensi berupa pay off yang akan diperoleh pemain. Pay off digambarkan dengan utilitas yang diperoleh pemain untuk masing-masing strategi yang diambil. Dapat berupa nilai, jumlah uang tertentu, prestise, emosi, maupun risiko.

Prisoner’s Dilemma

Model game Prisoner’s Dilemma ini merupakan salah satu model yang terkenal dalam Game Theory. Model yang diperkenalkan A.W. Tucker pada tahun 1940 an menggambarkan situasi dimana terdapat dua orang yang disangka melakukan kejahatan yang diperiksa secara terpisah. Dalam upaya untuk mencari siapa pelaku kejahatan dan mengupayakan agar kedua orang tersangka mengaku, maka polisi yang memeriksa menyatakan bahwa jika seorang tersangka mengaku sedangkan tersangka lainnya tidak mengaku, maka tersangka yang mengaku akan diberi potongan hukuman selama 7 tahun dan tersangka yang tidak mengaku akan dihukum selama 8 tahun. Jika kedua tersangka sama-sama mengaku, maka masing-masing akan dihukum selama 4 tahun. Namun jika keduanya tidak mengaku, maka polisi tidak mempunyai cukup bukti untuk menghukum mereka, sehingga masing-masing akan diberi hukuman selama 2 tahun.

Game ini dapat digambarkan dalam bentuk matrik dan dalam bentuk pohon game, yang akan dijelaskan maing-masing secara berurutan berikut ini.

Bentuk Matrik

Dalam bentuk matrik, game dilakukan secara bersama-sama dan masing-masing pemain tidak mengetahui strategi mana yang diambil oleh pemain lainnya. Kondisi game seperti ini disebut dengan metode simultan.

Gambar 1. Bentuk Matrik Game dari Prisoner’s Dilemma

Gambar 1 menjelaskan bahwa terdapat dua orang pemain, yaitu pemain 1 dan pemain 2. Masing-masing pemain mempunyai dua strategi, yaitu mengaku dan tidak mengaku. Pay off dari masing strategi pemain dinyatakan dalam angka negatif untuk menggambarkan berkurangnya utilitas yang dirasakan pemain jika mengambil suatu strategi. Pay off dituliskan secara berurutan dengan aturan bahwa pay off pertama merupakan pay off dari pemain 1, yang diikuti oleh pay off pemain 2.

Dalam upaya mencari strategi optimal masing-masing pemain mempertimbangkan strategi apa yang diekspektasikan diambil oleh pemain lainnya, dengan pertimbangan rasional, yaitu bahwa masing-masing pemain pasti akan mengambil pay off yang memberikan ulititas terbesar.

Sekarang kita coba berpikir secara logis mengenai strategi yang diambil oleh masing-masing pemain. Bagi pemain 1, dengan mempertimbangkan jika pemain 2 mengambil strategi mengaku, maka pemain 1 secara rasional akan mengambil strategi mengaku karena memberikan utiitas yang lebih besar, yaitu hukuman 4 tahun dibandingkan 8 tahun jika tidak mengaku. Namun jika pemain 2 mengambil strategi tidak mengaku, maka pemain 1 secara rasional mengambil strategi mengaku, karena memberikan ulitilas lebih besar, yaitu hukuman 1 tahun dibandingkan 2 tahun jika tidak mengaku. Di lain pihak, pemain 2 juga melakukan hal yang sama, dengan mempertimbangkan jika pemain 1 mengambil strategi mengaku, maka pemain 2 akan memilih mengaku dengan pay off hukuman 4 tahun. Dan jika pemain 1 mengambil strategi tidak mengaku, maka pemain 2 akan memilih mengaku.

Bentuk Pohon

Ketika kita sudah memahami prisonner dilemma dengan bentuk matrik, maka dengan analogi yang sama kita dengan mudah dapat memahami bentuk pohon. Satu hal yang membedakan kedua bentuk ini adalah, jika dalam bantuk matrik game dilakukan dengan metode simultan, pada bentuk pohon dimungkinkan game dengan metode dinamis. Yaitu pemain tidak bermain secara bersamaan namun bermain secara bergantian.

Gambar 2. Bentuk Pohon Game Prisoner’s Dilemma

Dalam bentuk pohon game, jika jumlah strategi dinyatakan dengan s, maka terdapat s² kombinasi strategi yang dapat digambarkan. Masing-masing strategi mempunyai 2 pay off yang merupakan pay off dari pemain 1 dan pemain 2.

Jika game dilakukan secara dinamis, maka pemain 2 mengetahui strategi yang telah dilakukan oleh pemain 1. Dalam gambar 2, terdapat garis putus-putus yang melingkari titik pemain 1 dan pemain 2. Garis tersebut disebut information set. Kedua pemain terdapat dalam lingkaran information set jika kedua pemain tidak mengetahui strategi pemain lainnya.

Nash Equilibrium

Dari kasus di atas, kedua pemain memilih mengaku, sehingga keseimbangan terjadi pada {mengaku; mengaku} dengan pay off {-4;-4} berupa hukuman masing-masing 4 tahun. Kondisi keseimbangan ini yang disebut dengan Nash Equilibrium. Jadi, definisi dari nash equilibrium adalah strategi yang dipilih oleh masing-masing pemain, dengan strategi pemain lain tertentu. Strategi ini merupakan strategi terbaik dari masing-masing pemain dengan mempertimbangkan strategi tertentu yang diambil oleh pemain lainnya, atau yang disebut dengan Best Respons.

Prisoner Dilemma Paradox

Seharusnya, kedua pemain mengharapkan keduanya sama-sama tidak mengaku, agar mendapatkan pay off yang terbesar, yaitu hukuman masing-masing 2 tahun saja. Namun demikian, pada kenyataannya, masing-masing pemain menginginkan utilitas sebesar-besarnya untuk dirinya sendiri pada setiap strategi yang diambilnya. Masing-masing menginginkan medapatkan potongan hukuman 7 tahun, dengan cara mengaku dan berharap pemain lain tidak mengaku, sehingga pay off yang diharapkan adalah hukuman 1 tahun untuk pemain itu sendiri dan hukuman 8 tahun untuk pemain lainnya. Karena game dilakuan secara simultan, maka keduanya memilih strategi secara bersamaan dan tidak saling mengetahui. Sehinga kedua pemain memilih mengaku dan masing-masing mendapatkan hukuman 4 tahun.

Penyelesaian masalah dalam prisoner’s dilemma adalah sangat mudah karena hanya ada 2 pemain dan 2 strategi yang dimainkan secara simultan. Pemahaman mekanisme penyelesaian masalah prisoner’s dilemma akan memudahkan kita memahami masalah-masalah lain yang lebih rumit nantinya.

Prisoner’s dilemma dapat digunakan untuk mengambil keputusan atas kebijakan dalam suatu unit organisasi baik perusahaan, pemerintahan, maupun organisasi lainnya. Sebagai contoh adalah ketika sebuah perusahaan mengambil keputusan akan melakukan promosi iklan atau tidak. Diasumsikan terdapat 2 perusahaan, yaitu perusahaan A dan B. Masing-masing memiliki strategi promosi iklan dan tidak promosi iklan. Dalam kondisi normal, dimana kedua perusahaan tidak melakukan promosi iklan, perusahaan A mampu melakukan penjualan sebesar 20 unit dan perusahaan B sebesar 35. Jika kemudian perusahaan A melakukan promosi iklan, sedangkan perusahaan B tidak melakukan promosi iklan, dengan asumsi bahwa produk kedua perusahaan ini bersifat saling menggantikan (substitusi), maka sebagian pelanggan perusahaan B akan berpindah ke perusahaan A. Di samping itu, promosi iklan juga mengundang pembeli baru yang mulanya tidak tertarik menjadi tertarik untuk membeli produk perusahaan A. Dengan demikian perusahaan A akan mendapatkan tambahan pembelian menjadi 30 dan perusahaan B penjualannya turun, menjadi 30.

Sebaliknya, jika perusahaan B melakukan promosi iklan dan perusahaan A tidak, maka penjualan perusahaan B akan meningkat menjadi 50. Kenaikan penjualan ini dikarenakan adanya pembeli baru dan pembeli yang awalnya membeli produk perusahaan A dan kemudian berpindah ke produk perusahaan B. Di lain pihak, penjualan perusahaan A menjadi 10. Namun jika kedua perusahaan melakukan promosi, konsumen memandang bahwa kedua perusahaan saling bersaing untuk memperebutkan pasar dan justru menimbulkan kesan negatif bagi konsumen, sehingga penjualan perusahaan A menjadi sebesar 15 dan perusahaan B sebesar 30.

Gambar 3. Prisoner’s Dilemma untuk Strategi Beriklan

Dengan kondisi di atas, maka nash equilibrium tercapat pada strategi {iklan; iklan} dengan pay off 15 untuk perusahaan A dan 33 untuk perusahaan B.