自律的なエージェントへの一大歩
OpenAIは、最新のAIモデルであるGPT-5.4を発表しました。このモデルは、推論、コーディング、スプレッドシート、ドキュメント、プレゼンテーションなどのプロフェッショナルな作業を含む多くの分野で進歩を遂げています。特に注目すべきは、デバイスやアプリケーション全体でタスクを実行できるネイティブなコンピュータ使用機能を初めて搭載したことです。
このモデルは、AIエージェントのネットワークがオンラインやソフトウェア内で複雑なタスクを実行するというAI会社が目指す自律的な未来への一歩と言えます。
GPT-5.4の機能
GPT-5.4は、キーボードやマウスのコマンドを発行し、スクリーンショットに応じてコンピュータを操作するコードを書く能力を持っています。また、ウェブブラウザでのパフォーマンスも向上し、ツールやAPIをより正確かつ効率的に呼び出すことができます。
さらに、GPT-5.4は、複数の情報源から情報を収集する質問に答え、それらを明確で論理的な回答にまとめることができます。
正確性とユーザー体験の向上
OpenAIは、GPT-5.4が「これまでで最も事実に基づいたモデル」として、個々の主張がGPT-5.2よりも33%少ない確率で誤りであると主張しています。
また、ChatGPTのGPT-5.4 Thinkingモデルは、複雑なクエリに対する作業の概要を提供し、ユーザーがリクエストを調整または変更できるようにします。
展開と利用
GPT-5.4は、ChatGPT、Codex、APIで展開され、GPT-5.4 ThinkingモデルはPlus、Team、Proユーザー向けに展開されます。また、API、ChatGPT Enterprise、Eduユーザー向けに「最大のパフォーマンスを発揮する複雑なタスク」向けのGPT-5.4 Proモデルも展開されます。
元記事: https://www.theverge.com/ai-artificial-intelligence/889926/openai-gpt-5-4-model-release-ai-agents
