AIのゲームスキルがまたUP。軍人将棋でも人間のプロレベルに到達

  • Twitter
  • Facebook
  • LINE
  • はてな
  • クリップボードにコピー
  • ×
  • …
AIのゲームスキルがまたUP。軍人将棋でも人間のプロレベルに到達
Image: DeepMind

軍人将棋って「ストラテゴ」ともいうのですね。

ボードゲーム、昨今は人間よりもAIの方が得意になりつつあります。チェスや囲碁の世界で存在感を確固たるものにしているAI。軍人将棋でも、人間がAIに負ける日は近いかも。

自身との対決で成長するAI

アルファベット傘下のDeepMindのリサーチチームが、最新研究の一部を米Gizmodoに解説してくれました。チームが開発したAI「DeepNash」の軍人将棋のスキルが人間のプロレベルにまで向上。対他のAIのゲーム勝率は97%で圧勝、人間とのオンライン対戦でもなんと勝率84%をマーク。チームの知る限り、軍人将棋でここまでレベルを上げたAIはこれが初めてだそう。DeepNashは自分自身と対戦し続けることでスキルアップしていくタイプで、今までのAIでは考えつかなかった桁外れな戦略を検討したり、複雑な決断が可能とのこと。

軍人将棋ってAIの訓練に向いてる?という意見もありつつ、実は不完全な情報の不完全な流入と長期的な決断力というこのゲーム独特の要素が、AIにとって非常にユニークな実験になっているそう。相手のコマが何かわからないので、予想を踏まえた自分の手は無数に考えられます。リサーチチームいわく、軍人将棋はテキサス・ホールデム ポーカーや囲碁よりも「今考えられる状況」の数が多いそう。

Video: DeepMind / YouTube

軍人将棋で勝つためには、AIは長期的戦略と短期的決断を同時に進める必要がありますが、今までのAIでは、限られた不確かな情報を元に決断し、長期的な戦略を立てるのは非常に難しくほぼ不可能。DeepNashはこれをうまくやれるレアなAIだと言えます。リサーチャーいわく「DeepNashはブラフを立てたり、必要なら賭けに出たりと、情報と素材の間で非自明なトレードを行なうことができました」。

DeepNashは、その名の通り、アメリカの数学者ジョン・ナッシュや、ゲーム理論のナッシュ均衡から影響を受けたAIです。自身のプレイとモデルフリー強化型ラーニングアルゴリズム「R-NaD」のコンビネーションを使い、軍人将棋にナッシュ均衡の考え方を取り入れています。アルゴリズムとディープニューラルネットワーク構造の両方を使うことで、リサーチチームは勝利のボットを生み出しました。

DeepNash自体は軍人将棋AIですが、DeepMindリサーチチームはこれでゲームの天才的セオリーを生み出したともいえそうです。

超気持ちいい!AIがテトリスをやるとこうなる

テトリスをやるとき、とにかく時間勝負ですばやく積み上げていく人と、できるだけ隙間を出さないよう慎重にブロックを並べていく人とでやり方が分かれますよね。そのどちら...

https://www.gizmodo.jp/2022/02/best-game-of-tetris-ever-a.html