無敵のポーカープログラムが完成か【科学誌サイエンス】

 

2人対戦のテキサスホールデムでは理論上無敵

テキサスホールデム

ポーカー実行プログラム「ポラリス」

2014年に日本を騒がせた米科学誌サイエンスに、注目すべき論文が掲載された。

プレイヤーが2人の場合には限定されるが、テキサスホールデムポーカーで理論上負けないとされるコンピュータプログラムが開発されたとのこと。

テキサスホールデムのプレイルール・用語の解説はこちら

プロジェクトはアルバータ大学(カナダ)マイケル・ボーリング氏を中心とする研究チームによって2003年から研究開発をスタート。

「現在の超一流プレイヤー・戦略に負けない、完璧なプレイヤーを作り出すこと」を目標として開発されたこのプログラムの名は「ポラリス(Polaris)」。

同研究チームは2008年にポラリスを完成させ、2人対戦のテキサスホールデムでその時点の人間の超一流プレイヤーに勝利した。

ボーリング氏曰く、「この時点でテキサスホールデムにおいて、ポラリスが全ての人間より強いプレイヤーとしての地位を確立した」とのこと。

そこで、同チームは次のように考えを次のステップに進めた。

「ポラリスがテキサスホールデムで人間に勝てることは分かった。それではこのゲームそのものを【解く】ことはできるのだろうか。」

そこから4800個のCPU(中央演算処理装置)群による計算が始まり、その結果がでるまでには2ヵ月もの歳月を要した。

結果としては、「このゲームを本質的に【弱】解決した」ようだ。

弱解決といってもあまり意味は伝わらないだろう。

もう少しわかりやすい言い方をすると、「統計的に負けることのないほぼ完璧な戦略を導き出した」ということだ。

ボーリング氏によれば、人間が一生涯にプレー可能なゲーム数(約6000万回)プレーした場合でも、負ける可能性が運によるものか否かさえも区別できないほど小さいとのこと。

 

人間vsコンピュータ

今までもゲームでコンピュータが人間に勝利した事例はある。

1994年にボードゲーム「チェッカー」の世界選手権で人間に勝った「チヌーク」や、1997年にチェスで当時の世界チャンピオンに勝利した「ディープブルー」、2011年には高性能コンピュータ「ワトソン」がアメリカのクイズ番組で優勝している。

日本でも将棋で人間はコンピュータに敗北している。

ただ、これまでの事例と違う可能性をポラリスは秘めている。

チェスや将棋では、盤面はすべて見えているし、相手の手ごまも分かっている。

しかし、テキサスホールデムでは相手プレイヤーの2枚のカードが何なのかはわからない。

そのようなゲームを「不完全情報ゲーム」という。

その中でもテキサスホールデムはコンピュータプログラムにとって、特に難題であるとされていた。

ポラリスはただ「ポーカーで人間に勝てる」ということを示しただけの存在ではないのだ。

現実世界における様々な事象はまさに「不完全情報ゲーム」である。

つまりポラリスという名のアルゴリズムは、不確定性と不明情報を含む現実世界の状況における意思決定の際に、より効果的な解決策を導き出す助けになる可能性もあるということだ。

 

日本カジノ情報(JCI)のコメント

現在カジノにおいて、ロボット化・オートメーション化が着々と進んでいる。

それは、ポラリスのような「思考力」を持ったものではなく、あくまでも作業を効率化するためのものであるが、今後ポラリスのようなものも多く登場するかもしれない。

ロボットの究極の「ポーカーフェイス」を人間は見破ることはできないのだろうか。

下部にコメント欄があるので皆さまからもばしばし意見をよせていただきたいです↓

  • このエントリーをはてなブックマークに追加
  • Pocket

この記事へのコメントはこちら

内容に問題なければ、下記の「コメント送信」ボタンを押してください。