OpenAIが新画像生成モデル「GPT-Image-1.5」を発表
OpenAIは、ChatGPTの画像機能の最新バージョンである「GPT-Image-1.5」の提供を開始しました。この新モデルは、指示への追従性の向上、より精密な編集機能、そして最大4倍の画像生成速度を実現しており、AI分野での競争が激化する中で同社の主要な一歩となります。
GPT-Image-1.5は、すべてのChatGPTユーザーおよびAPIを通じて利用可能です。昨年4月にリリースされたGPT-Image-1以来の画像モデルアップデートであり、当初1月に予定されていたリリース計画が加速された形です。
詳細機能とユーザー体験の向上
新モデルの最も注目すべき改善点の一つは、ポストプロダクション機能です。顔の類似性、ライティング、構図、色調といった視覚的な一貫性を編集全体で維持できるようになり、既存の多くのGenAI画像ツールが苦手としていた「特定の変更を要求すると画像全体が再解釈されてしまう」という課題を解決します。
ユーザー体験も大きく改善されています。ChatGPTのサイドバーに専用のエントリポイントが設けられ、「クリエイティブスタジオ」のような機能を提供します。これにより、画像の表示や編集が容易になり、トレンドのプロンプトやプリセットフィルターからインスピレーションを得ることも可能になります。
OpenAIのアプリケーション担当CEOであるフィジー・シーモ氏は、「作成時には、制作中のものを見て形作ることができるべきだ」と述べ、将来的にはChatGPTの検索クエリでより多くの視覚要素(測定値の変換やスポーツのスコアチェックなど)を明確な情報源とともに表示する計画も示唆しており、ユーザーの思考と創造の間の距離を縮めることを目指しています。
Googleとの激化するAI競争
今回のGPT-Image-1.5のリリースは、OpenAIが「コードレッド」宣言を行ったとされるAI分野での激しい競争の中で行われました。サム・アルトマンCEOは、Googleが「Gemini 3」や「Nano Banana Pro」などのモデルで市場シェアを拡大していることを受け、AIリーダーとしての地位を取り戻すべく社内で「コードレッド」を宣言したと報じられています。
OpenAIは先週、「GPT-5.2」をリリースしてGoogleの成功に対抗しましたが、今回の画像生成モデルの強化は、急速に進化する生成AI市場におけるリーダーシップ争いをさらに加熱させるものと見られています。画像生成およびビデオ生成ツールは、プロトタイプ段階を超え、より実用的な生産レベルの機能を獲得しつつあり、今後も両社の動向が注目されます。
