GoogleのAI研究エージェント「Gemini Deep Research」が登場
2025年12月11日木曜日、Googleは最先端の基盤モデル「Gemini 3 Pro」をベースにした、刷新された研究エージェント「Gemini Deep Research」を発表しました。この新しいエージェントは、単に研究レポートを作成するだけでなく、開発者がGoogleの高度な研究能力を自身のアプリケーションに組み込むことを可能にします。
この機能は、「Interactions API」を通じて提供され、エージェントAIの時代において開発者により詳細な制御を提供するために設計されています。Gemini Deep Researchツールは、膨大な情報を統合し、プロンプト内で大量のコンテキストを処理できる強力なエージェントです。Googleによると、このツールはデューデリジェンスから薬剤毒性安全性研究まで、幅広いタスクで顧客に利用されています。
Googleは、この新しいディープリサーチエージェントを、Google検索、Google Finance、Geminiアプリ、人気のNotebookLMといった既存サービスに間もなく統合すると述べています。これは、人間がもはや何かを「Google検索」するのではなく、AIエージェントがその役割を果たす世界への一歩となります。
高精度と幻覚抑制への取り組み
Googleは、Gemini Deep ResearchがGemini 3 Proの「最も事実に忠実な」モデルとしての地位から恩恵を受けており、複雑なタスク中の幻覚(ハルシネーション)を最小限に抑えるように訓練されていると強調しています。
AIが事実に基づかない情報を作り出す「幻覚」は、長時間の深い推論を伴うエージェントタスクにおいて特に重要な問題です。多くの自律的な決定が数分、数時間、あるいはそれ以上かけて行われる中で、たった一つの幻覚を伴う選択が、全体の出力の妥当性を損なう可能性を大いに高めるためです。
新たなベンチマークと競争の激化
Googleは、その進歩を証明するために、新たなベンチマーク「DeepSearchQA」を作成しました。これは、複雑な多段階の情報探索タスクでエージェントをテストすることを目的としており、Googleはこのベンチマークをオープンソース化しています。
Deep Researchは、他にも一般知識の独立したベンチマークである「Humanity’s Last Exam」や、ブラウザベースのエージェントタスクのベンチマークである「BrowserComp」でもテストされました。結果として、Googleの新しいエージェントは、自身のDeepSearchQAとHumanity’s Last Examで競合他社を上回る成績を収めました。しかし、OpenAIの「ChatGPT 5 Pro」も驚くほど僅差で続き、BrowserCompではGoogleをわずかに上回りました。
OpenAI「GPT 5.2 (Garlic)」の同時発表
これらのベンチマーク比較は、Googleが発表したほぼ瞬間に時代遅れとなりました。なぜなら、その同じ日、OpenAIは待望の「GPT 5.2」(コードネーム「Garlic」)を発表したからです。OpenAIは、その最新モデルが、OpenAI独自のベンチマークを含む一連の標準的なベンチマークにおいて、競合他社、特にGoogleを凌駕すると主張しています。
今回の発表で最も興味深い点の一つは、そのタイミングでしょう。世界がGarlicのリリースを待ち望んでいることを知りながら、Googleは自身のAIニュースを投入したのです。
