AIがゲームで混乱する理由を解明

GoogleのDeepMindグループは、そのAlphaシリーズのゲームプレイAIによって、チェスや囲碁などのゲームをマスターする方法を発見したかのように見えました。しかし、人々が新しいゲームプレイヤーがゲームをプレイする際に失敗するが、同様の囲碁AIに対して勝利するようなポジションを特定するようになると、奇妙なことが起こりました。

AIに対してボードゲームで勝利することは、それほど重要なこととは思われませんが、AIの失敗モードを特定するのに役立ちます。また、AIのトレーニングを改善することで、これらの盲点を事前に避けることができます。

新しい研究：AIのトレーニング方法が失敗するゲームのカテゴリー

最近の論文は、AlphaGoやAlphaChessのトレーニング方法が失敗するゲームのカテゴリーを説明しています。そのゲームは非常にシンプルで、研究者が使用したNimというゲームがその代表例です。

Nimは、マッチ棒をピラミッド型のボードから取り除くゲームで、プレイヤーは順番にマッチ棒を取り除きます。このゲームは、棋譜が同じである「不偏ゲーム」の代表的な例です。

AIのトレーニングが失敗する理由

新しい研究では、AlphaZeroのようなAIのトレーニング方法がNimのようなゲームに対して失敗する理由を説明しています。Nimでは、ボードの状態を評価し、最適な手を識別する「パリティ関数」が必要です。

しかし、このパリティ関数を学習するためには、AIがゲームをプレイするだけでは不十分であり、特定のゲーム状態から一般的なルールを推論するためのシンボル的な思考が必要です。

チェスでも同様の問題が発生する可能性

研究者たちは、チェスでも同様の問題が発生する可能性があると指摘しています。チェスでは、長期間の思考が必要なマッティング攻撃や終盤の手を誤って評価することがあります。

これらの結果は、AIが数学的な問題を解決するためのシンボル的な思考を学習する能力に制限があることを示しています。

元記事: https://arstechnica.com/ai/2026/03/figuring-out-why-ais-get-flummoxed-by-some-games/

サイバーニュース.jp

AIがゲームで混乱する理由を解明