Google Project Genieとは
Googleは、テキストプロンプトや写真からインタラクティブな仮想世界を生成できるAIモデル「Project Genie」をより広範なユーザーに提供開始しました。昨年発表された「Genie 3」の進化版であり、動的な環境をリアルタイムで生成する「ワールドモデル」の一種です。
Project Genieは、単なる3D世界を生成するわけではありません。ユーザーの操作入力に反応するビデオを作成することで、まるで実際の仮想世界を探検しているかのような体験を提供します。ユーザーは画像を提供するか、環境やキャラクターに関する簡単な指示を与えるだけで、システムがまず静止画像を生成し、そこからインタラクティブな世界を構築します。これをGoogleは「ワールドスケッチング」と呼んでいます。
提供状況と価格
現在、Project Genieは、Googleの最も高価なAIサブスクリプションである「AI Ultra」(月額250ドル)の加入者のみが利用可能です。このツールは専用のWebアプリケーションとして提供され、Geminiアプリやウェブサイトへの統合はされていません。Googleは、AIビデオの生成コストが高いため、まずはこの高額なティアから提供を開始し、将来的にはより多くのユーザーにアクセスを開放する方針を示しています。
技術的特徴と体験
Project Genieは、「Nano Banana Pro」や「Gemini 3」といった最新のAIモデルと連携しています。生成されるビデオは720p、秒間約24フレームでレンダリングされ、WASDキーによるキャラクター移動に合わせて、ユーザーの進行方向がほぼリアルタイムでレンダリングされます。
また、Googleはいくつかの「事前に構築された世界」も提供しており、ユーザーはこれらを新しいキャラクターやビジュアルスタイルで「リミックス」することも可能です。生成された探検ビデオはダウンロードして保存できます。
現在の限界と課題
Googleは、Project Genieがまだ研究プロトタイプの段階であることを強調しており、いくつかの制限事項が存在します。主な課題としては、入力遅延があること、各世界を探索できる時間が最大60秒に制限されていること、そして「Genie 3」でデモされた「プロモータブルイベント」(シミュレーション中に新しい要素を挿入する機能)がまだ利用できないことが挙げられます。
また、GoogleはGenieが物理法則を正確にモデル化する能力を強調しているものの、テスターは物理法則が不正確に見える世界に遭遇する可能性もあります。コンテンツに関する制限も変更される可能性があり、以前は生成できた他社ゲームの模倣プロンプトがブロックされるようになった事例も報告されています。
