Waymo、自動運転AI訓練にGoogle DeepMindの「Genie 3」を活用した画期的な「World Model」を導入

Waymo、自動運転AI訓練に画期的な「World Model」を導入

自動運転技術のリーディングカンパニーであるWaymoは、Google DeepMindが開発した「Genie 3」を基盤とした新たな「Waymo World Model」を導入し、自動運転AIの訓練方法に革新をもたらそうとしています。このモデルは、これまでの2億マイルを超える実走行データに加え、仮想空間で数十億マイルの学習を可能にする「超現実的な」シミュレーション環境を生成します。

従来の課題とGenie 3の登場

自動運転業界はこれまで、実際の車両から収集された訓練データに依存してきました。しかし、これにより、「ゴールデンゲートブリッジの雪景色」のような稀な、あるいは遭遇したことのない状況が訓練データに十分に表現されないという課題がありました。Waymo World Modelは、この問題を解決することを目指しており、エンジニアは簡単なプロンプトと運転入力で様々なシミュレーションを作成できます。

Genie 3の驚異的な記憶力とシミュレーション能力

Googleが昨年発表したGenie 3は、その「長期間の記憶能力」によって他のワールドモデルを大きく凌駕します。これにより、シミュレーション内で一度視野から外れたオブジェクトも、数分後に再び見てもその状態を「記憶」しているため、より一貫性のある仮想世界を体験できます。Genieモデルは3D空間を直接生成するのではなく、探索可能な世界のように感じさせるほど高速にビデオをレンダリングする技術です。

Waymo World Modelの独自進化:2D映像と3D LiDARデータ統合

Waymo World Modelは単にGenie 3を移植したものではありません。WaymoとDeepMindは、2Dビデオと3D LiDAR出力の両方を同じシーンで生成するための特殊な後処理プロセスを開発しました。カメラは詳細な視覚情報を提供しますが、LiDARは自動運転車が「見る」ものに不可欠な奥行き情報を提供するため、この統合は極めて重要です。

多様なシナリオへの対応:AI訓練の可能性を広げる

この世界モデルを活用することで、Waymoは車両のビデオを取り込み、プロンプトを使って車両が取るルートを変更するなど、「運転アクション制御」を伴うシミュレーションを可能にします。これにより、従来の再構築シミュレーションよりも高いリアリズムと一貫性が実現します。また、一般的なダッシュカムビデオからWaymoのマルチモーダルセンサーデータを生成することも可能で、「時間帯の変更」「天候の変動」「新しい標識の追加」、さらには「道路上のゾウ」といった稀なイベントをシミュレーションし、AIを訓練することができます。これにより、フェニックスのような常に晴れた地域だけでなく、ボストンやワシントンD.C.といったより多様な気象条件の市場への対応も強化されます。

未来への展望と課題

Waymoは、Genie 3の技術が自動運転車のAIを教育できるレベルまで向上したと確信しています。この新モデルの成功は、Genie 3が現実世界をどれだけ正確にシミュレートできるかにかかっていますが、この技術が自動運転の安全性と汎用性を大きく向上させる可能性を秘めていることは間違いありません。


元記事: https://arstechnica.com/google/2026/02/waymo-leverages-genie-3-to-create-a-world-model-for-self-driving-cars/