軍人将棋って「ストラテゴ」ともいうのですね。
ボードゲーム、昨今は人間よりもAIの方が得意になりつつあります。チェスや囲碁の世界で存在感を確固たるものにしているAI。軍人将棋でも、人間がAIに負ける日は近いかも。
自身との対決で成長するAI
アルファベット傘下のDeepMindのリサーチチームが、最新研究の一部を米Gizmodoに解説してくれました。チームが開発したAI「DeepNash」の軍人将棋のスキルが人間のプロレベルにまで向上。対他のAIのゲーム勝率は97%で圧勝、人間とのオンライン対戦でもなんと勝率84%をマーク。チームの知る限り、軍人将棋でここまでレベルを上げたAIはこれが初めてだそう。DeepNashは自分自身と対戦し続けることでスキルアップしていくタイプで、今までのAIでは考えつかなかった桁外れな戦略を検討したり、複雑な決断が可能とのこと。
軍人将棋ってAIの訓練に向いてる?という意見もありつつ、実は不完全な情報の不完全な流入と長期的な決断力というこのゲーム独特の要素が、AIにとって非常にユニークな実験になっているそう。相手のコマが何かわからないので、予想を踏まえた自分の手は無数に考えられます。リサーチチームいわく、軍人将棋はテキサス・ホールデム ポーカーや囲碁よりも「今考えられる状況」の数が多いそう。
軍人将棋で勝つためには、AIは長期的戦略と短期的決断を同時に進める必要がありますが、今までのAIでは、限られた不確かな情報を元に決断し、長期的な戦略を立てるのは非常に難しくほぼ不可能。DeepNashはこれをうまくやれるレアなAIだと言えます。リサーチャーいわく「DeepNashはブラフを立てたり、必要なら賭けに出たりと、情報と素材の間で非自明なトレードを行なうことができました」。
DeepNashは、その名の通り、アメリカの数学者ジョン・ナッシュや、ゲーム理論のナッシュ均衡から影響を受けたAIです。自身のプレイとモデルフリー強化型ラーニングアルゴリズム「R-NaD」のコンビネーションを使い、軍人将棋にナッシュ均衡の考え方を取り入れています。アルゴリズムとディープニューラルネットワーク構造の両方を使うことで、リサーチチームは勝利のボットを生み出しました。
DeepNash自体は軍人将棋AIですが、DeepMindリサーチチームはこれでゲームの天才的セオリーを生み出したともいえそうです。