AIの次なるフロンティア:世界モデルがもたらす変革

AIの「世界モデル」とは何か?

AI分野において、「世界モデル」が次なる大きなトレンドとして注目を集めています。これは、AIに人間のような空間理解を与え、現実世界と相互作用できるエージェントを訓練するための研究分野です。例えば、ロボットがテーブルから落ちそうな水の入ったグラスを予測し、落下する前に掴むといった行動を可能にすることを目指しています。

General Intuitionの誕生とMedalの戦略的転換

この動きの中心にいるのが、ゲームクリッピングプラットフォーム「Medal」からスピンアウトした新AIラボ「General Intuition」です。Medalは年間約20億件ものゲーム動画をアップロードしており、この膨大なデータがAIの3D環境ナビゲーション学習に極めて価値があることが判明しました。Medalの創設者であるPim de Witte氏は、このデータの価値を認識し、複数の買収提案を断ってGeneral Intuitionを設立。OpenAIへの初期投資家であるVinod Khosla氏が主導し、1億3370万ドルのシードラウンドを調達しました。Khosla氏は、General IntuitionがAIエージェント分野において、OpenAIが大規模言語モデル(LLM)にもたらしたような影響を与える可能性があると評価しています。

世界モデル研究の最前線と応用可能性

世界モデルの重要性を最も強く提唱しているのは、Google DeepMindのCEOであるDemis Hassabis氏です。Googleは最近、ユーザーの操作に応じてゲームのような環境をゼロから生成するモデル「Genie 3」をデモしました。また、Fei-Fei Li氏のWorld Labsも、リアルタイムでインタラクティブな動画を生成するモデルを発表しています。

General Intuitionの目標は、キーボード、マウス、またはゲームコントローラーにマッピングできるあらゆる種類のデバイスを制御することです。初期の応用としては、捜索救助ドローンが挙げられていますが、将来的には人型ロボットや自動運転車への応用も視野に入れています。de Witte氏は、LLMがインターネットのテキストデータで訓練されたように、ゲーム環境がAIが物理世界で適切な行動を予測する能力を解き放つ鍵となると考えています。彼は、ゲームが「空間的・時間的推論のための唯一検証可能な領域」であり、良い行動と悪い行動を区別できる点が非常に価値があると説明しています。

課題と市場の展望

しかし、世界モデルの開発には課題も存在します。最適な技術的アプローチについてはAI業界内で活発な議論があり、どのデータが最終的に最も価値があるかはまだ不明確です。また、Googleのような資金力のある巨大企業との競争も激しいです。Khosla氏は、この市場から「数千億ドル、潜在的には数兆ドル規模の企業が生まれる」と予測しており、de Witte氏も世界モデルへの関心が高まるにつれて、ゲーム会社がAIラボの買収ターゲットになる可能性を指摘しています。


元記事: https://www.theverge.com/column/801370/ai-world-models-general-intuition-medal