Keuntungan poker dibandingkan dengan komputer
5 min read
BARU YORK – Juara poker Phil LaHA memiliki peluang bagus untuk menang ketika dia duduk untuk memainkan 2.000 tangan minggu ini Texas Hold’em – melawan komputer. Ini mungkin kesempatan terakhir yang didapatnya. Komputer menjadi lebih baik dalam poker dalam beberapa tahun terakhir; mereka sekarang cukup bagus untuk menantang para profesional papan atas seperti Laak, yang Tur Poker Dunia undangan pada tahun 2004. Tapi itu hanya masalah waktu sebelum mesin memimpin perang supremasi poker.
Sama seperti yang sudah mereka miliki dalam backgammon, catur, dan catur, komputer diperkirakan akan melampaui bahkan pemain poker manusia terbaik dalam satu dekade. Mereka sudah bisa mengalahkan hampir semua pemain amatir.
“Pertandingan ini sangat penting karena ini pertama kalinya akan ada peristiwa manusia-mesin yang didalamnya terdapat komponen ilmiah,” kata profesor ilmu komputer Universitas Alberta, Jonathan Schaeffer.
Kelompok penelitian permainan di universitas Kanada dianggap yang terbaik di dunia. Setelah mengalahkan program yang dirancang Alberta beberapa tahun lalu, Laak sangat terkesan hingga memperkirakan keunggulannya hanya 5 persen. Dia rasa dia akan kalah jika para peneliti tidak membiarkan dia memeriksa kode pemrograman dan berlatih melawan mesin sebelumnya.
“Robot ini akan bekerja dengan baik,” prediksi Laak.
Para peneliti Alberta melengkapi permainan senilai $50.000 dengan desain yang cerdik, menjadikannya kompetisi manusia-mesin pertama yang menghilangkan keberuntungan undian sebanyak mungkin.
Laak akan bermain bersama rekannya, sesama pro Ali Eslami. Keduanya akan berada di ruangan terpisah, dan permainan mereka akan menjadi bayangan cermin satu sama lain, dengan Eslami mendapatkan kartu yang dibagikan komputer melawan Laak, dan sebaliknya.
Dengan begitu, tangan yang lemah untuk satu pemain manusia akan menghasilkan tangan yang kuat untuk rekannya di ruangan lain. Di akhir turnamen, chip kedua orang akan dijumlahkan dan dibandingkan dengan komputer.
Kompetisi dua hari yang dimulai Senin ini tidak berlangsung di kasino, melainkan di konferensi tahunan Asosiasi Kemajuan Kecerdasan Buatan di Vancouver, British Columbia. Para peneliti di bidang ini semakin tertarik pada poker dalam beberapa tahun terakhir karena salah satu masalah terbesar yang mereka hadapi adalah bagaimana menangani ketidakpastian dan informasi yang tidak lengkap.
“Anda tidak memiliki informasi yang sempurna tentang keadaan permainan, dan terutama kartu apa yang dimiliki lawan Anda,” kata Dana S. Nau, profesor ilmu komputer di Universitas Maryland di College Park. Artinya, ketika lawan melakukan sesuatu, Anda tidak bisa memastikan alasannya.
Oleh karena itu, jauh lebih sulit bagi pemrogram komputer untuk mengajari komputer cara bermain poker dibandingkan permainan lainnya. Dalam catur, catur, dan backgammon, setiap permainan dimulai dengan cara yang sama, dan kemudian berkembang melalui sejumlah kemungkinan keadaan yang sangat besar namun terbatas berdasarkan seperangkat aturan yang konsisten. Dengan daya komputasi yang cukup, komputer dapat dengan mudah membuat pohon dengan cabang yang mewakili setiap kemungkinan langkah masa depan dalam permainan, dan kemudian memilih salah satu yang paling langsung mengarah pada kemenangan.
Ini pada dasarnya adalah strategi yang digunakan komputer Deep Blue IBM untuk mengalahkan juara catur Gary Kasparov dalam pertandingan terkenal mereka pada tahun 1997. Tidak ada komputer yang dapat menghitung setiap kemungkinan gerakan dalam permainan catur, namun program catur terbaik saat ini dapat memprediksi 18 gerakan yang menakjubkan.
Namun poker tidak hanya melibatkan banyak kemungkinan, namun juga ketidakpastian, baik tentang kartu apa yang dimiliki lawan dan yang lebih penting, bagaimana dia akan memainkannya.
“Sangat penting bagi Anda untuk memahami bagaimana orang lain mendekati permainan tersebut. Itu adalah informasi penting dalam poker, dan itu tidak berlaku untuk permainan lain yang telah kami pelajari di dunia akademis,” kata Darse Billings, seorang Ph.D. yang telah bekerja pada robot selama 15 tahun – kecuali istirahat tiga tahun untuk bermain poker secara profesional.
Pendekatan pohon permainan tidak berhasil dalam poker karena dalam banyak situasi tidak ada satu langkah terbaik. Bahkan tidak ada strategi terbaik. Seorang pemain top menyesuaikan permainannya dari waktu ke waktu dan mengeksploitasi perilaku lawannya. Dia menggertak melawan pengecut dan melanjutkan dengan hati-hati ketika pemain yang hanya menaikkan dengan tangan terkuat mempertaruhkan batasnya. Dia belajar bagaimana mengubah strateginya sendiri sehingga orang lain tidak bisa memanfaatkannya.
Wawasan seperti itu sangat sulit untuk diprogram ke dalam komputer. Anda tidak bisa begitu saja memberikan beberapa aturan pada mesin untuk dipatuhi, karena setiap pemain manusia yang cukup kompeten akan dengan cepat mengetahui apa yang akan dilakukan komputer dalam berbagai situasi.
“Yang membuat poker menarik adalah tidak ada resep ajaib,” kata Schaeffer.
Faktanya, program bermain poker yang paling sederhana gagal karena itu hanyalah sebuah resep, seperangkat aturan yang memberi tahu komputer apa yang harus dilakukan berdasarkan kekuatan tangannya. Lawan yang berpengalaman dapat segera menentukan kartu mana yang dimiliki komputer berdasarkan seberapa agresif taruhannya.
Begitulah cara Laak mampu mengalahkan program bernama Poker Probot dalam kompetisi dua tahun lalu di Las Vegas. Seiring berjalannya permainan, Laak dengan tepat merasakan bahwa komputer memainkan permainan yang agresif secara konsisten, dan memanfaatkan pengamatan tersebut dengan menyesuaikan permainannya sendiri.
Pemrogram dapat menghilangkan sebagian kelemahan tersebut dengan teori permainan, cabang matematika yang dipelopori oleh John von Neumann, yang juga membantu mengembangkan bom hidrogen. Pada tahun 1950, ahli matematika John Nash, yang hidupnya menginspirasi film “A Brilliant Mind”, menunjukkan bahwa dalam permainan tertentu terdapat serangkaian strategi sedemikian rupa sehingga hasil setiap pemain dimaksimalkan dan tidak ada pemain yang mendapat manfaat dari beralih ke strategi yang berbeda.
Dalam permainan sederhana “Batu, Kertas, Gunting”, misalnya, strategi terbaik adalah memilih setiap opsi secara acak dalam jumlah waktu yang sama. Jika ada pemain yang menyimpang dari strategi tersebut dengan mengikuti suatu pola atau memilih salah satu opsi, pemain lain akan segera memperhatikan dan menyesuaikan permainan mereka untuk mengambil keuntungan.
Texas Hold ‘em sedikit lebih rumit daripada “Batu, Kertas, Gunting”, namun perhitungan Nash tetap berlaku. Dengan teori permainan, komputer mengetahui cara mengubah permainannya sehingga lawan kesulitan mengetahui apakah mereka menggertak atau menggunakan strategi lain.
Namun teori permainan mempunyai keterbatasan. Dalam istilah ekuilibrium Nash, sukses bukan berarti menang, bukan berarti kalah.
“Pada dasarnya Anda menghitung formula yang setidaknya bisa mencapai titik impas dalam jangka panjang tidak peduli apa yang dilakukan lawan Anda,” kata Billings.
Di situlah program poker terbaik saat ini. Meskipun program berbasis teori permainan terbaik biasanya mampu bertahan melawan pemain poker manusia kelas dunia, program tersebut tidak cukup baik untuk menang besar secara konsisten.
Memaksimalkan kinerja ekstra dari komputer memerlukan penggabungan kekuatan matematis teori permainan dengan kemampuan mengamati dan beradaptasi dengan permainan lawan. Banyak pemain poker legendaris melakukan ini dengan menjadi ahli dalam sifat manusia. Mereka dengan cepat mempelajari tics, gerak tubuh, dan “cara” lainnya yang mengungkapkan dengan tepat apa yang sedang dilakukan pemain lain.
Komputer tidak dapat mendeteksinya, tetapi dapat melacak cara lawan memainkan permainan tersebut. Ia dapat mengamati seberapa sering lawan mencoba menggertak dengan tangan yang lemah, dan seberapa sering dia melakukan lipatan. Kemudian komputer dapat mengambil informasi tersebut dan memasukkannya ke dalam perhitungan yang memandu permainannya sendiri.
“Ide untuk membentuk semacam model seperti apa pemain lain…adalah masalah yang sangat penting,” kata Nau.
Ilmuwan komputer kini mulai memasukkan kemampuan tersebut ke dalam program mereka; beberapa hari sebelum kompetisi mereka dengan Laak dan Eslami, peneliti Universitas Alberta masih mencoba mengubah elemen adaptif program mereka. Billings hanya akan mengatakan ini tentang apa yang ada di benak penonton: “Mereka dijamin akan melihat banyak gaya berbeda.”
Meski begitu, Laak dan Eslami adalah pemain top dengan pemahaman mendalam tentang dasar matematika poker. Mereka harus mampu mengikuti perkembangan komputer – kali ini.