OpenAI、自律コーディングAI「GPT-5.1 Codex-Max」を発表:セキュリティ強化への寄与も期待

OpenAI、自律コーディングに特化した「GPT-5.1 Codex-Max」をリリース

OpenAIは、コーディングタスクにおいて大幅な性能向上を遂げた最新モデル「GPT-5.1 Codex-Max」の展開を開始しました。この新モデルは、数時間にわたって自律的にコーディング作業を実行できる能力を持つと、OpenAIはXへの投稿で発表しています。この進化は、ソフトウェア開発の効率化だけでなく、セキュアなコードの生成や脆弱性対応の迅速化といったセキュリティ面での恩恵も期待されます。

一般的な研究や対話、画像生成に最適化されたGPT-5.1とは異なり、Codexシリーズはコーディング関連タスクに特化して設計されています。ターミナル内で動作するほか、GitHubと接続することでウェブ上でも利用可能です。

飛躍的な進化を遂げたCodexとセキュリティへの影響

過去数ヶ月で、Codexは著しい進化を遂げ、Claude Codeと直接的な競争を繰り広げています。OpenAIは、GPT-5.1のリリース後、複雑なクエリにおいてはCodexがClaudeを上回ると評価していますが、Claude Codeは依然として規律性において優位を保っているとしています。

しかし、GPT-5.1 Codex-Maxの登場により、Codexはさらに高速化、高性能化、そしてトークン効率の向上を実現しました。特に、内蔵された圧縮機能により、長時間のタスクにわたって持続的に作業を遂行できる点が大きな特徴です。これにより、開発者はより多くの時間をセキュリティレビューやアーキテクチャ設計に費やすことが可能になり、ソフトウェア全体のセキュリティ品質向上に貢献する可能性があります。

Windows環境への対応と性能指標が示す汎用性

OpenAIは、「GPT-5.1 Codex-Maxは、実際のエンジニアリングタスクにおいてGPT-5.1 Codexを凌駕し、Windows環境での動作を前提にトレーニングされた初のCodexモデルである」と述べています。これにより、PowerShellの利用能力も向上し、Windowsマシンにおけるより優れた協力者となり得ると期待されます。Windows環境でのサポート強化は、より広範なエンタープライズシステムでの利用を促進し、セキュリティ関連のスクリプト作成や自動化にも寄与するでしょう。

ベンチマークテスト「SWE-Bench Verified」では、GPT-5.1 Codexと比較して、中程度の推論能力でより優れたパフォーマンスを発揮しつつ、約30%少ない思考トークンを使用していることが確認されました。これは、効率的かつ正確なコード生成能力が、潜在的なバグや脆弱性の低減に繋がる可能性を示唆しています。

利用可能状況

GPT-5.1 Codex-Maxは、Codex CLI、IDE拡張機能、クラウド、およびコードレビュー環境で本日より利用可能です。


元記事: https://www.bleepingcomputer.com/news/artificial-intelligence/openai-says-its-latest-gpt-51-codex-can-code-independently-for-hours/