OpenAI、GPT-4oの有害活動検出時に安全モデルへルーティングを実施

OpenAI、GPT-4oの有害活動検出時に安全モデルへルーティング

OpenAIの最新モデルであるGPT-4oが、特定の状況下で未知のモデルにリクエストをルーティングしていることが週末にユーザーによって報告されました。この現象は、有害な活動を検出した際の「安全」機能であることが判明しました。

通常、ChatGPTは「オートモード」でGPT-5を使用している際に、より高度な思考をAIに要求すると、リクエストを「GPT-5-thinking」にルーティングすることがあります。しかし、今回ユーザーを動揺させているのは、GPT-4oの会話が、特に機密性の高い、または感情的なトピックに触れた場合、あるいは何らかの有害な活動と判断された場合に、異なるモデル、おそらくGPT-5のバリアントである「gpt-5-chat-safety」に切り替わるという点です。

安全ルーティングのメカニズム

OpenAIはこれらの報告を認め、その意図が悪意のあるものではないと説明しています。ChatGPTのVPであるNick Turley氏はX（旧Twitter）への投稿で、「ルーティングはメッセージごとに行われ、デフォルトモデルからの切り替えは一時的なものです。ChatGPTは、尋ねられた際にどのモデルがアクティブであるかを伝えます」と述べました。さらに、「以前にも述べたように、会話が機密性の高い、または感情的なトピックに触れる場合、システムはチャット中にこれらのコンテキストをより慎重に扱うように設計された推論モデルまたはGPT-5に切り替わる可能性があります」と付け加えています。

安全対策の目的と不可避性

このルーティング機能は、OpenAIが安全対策を強化し、広範な展開の前に実世界での利用から学ぶための広範な取り組みの一部であるとされています。この機能はOpenAIの実装の一部であるため、ユーザーがルーティングをオフにすることはできません。

セキュリティレポートの警告：パスワードクラッキングの増加

関連するセキュリティニュースとして、Picus Blue Report 2025が発表されました。このレポートによると、パスワードクラッキングが前年比で2倍に増加し、昨年25%だったのに対し、今年は46%の環境でパスワードがクラッキングされたことが明らかになりました。この報告は、AIの安全対策だけでなく、基本的なサイバーセキュリティ対策の重要性も浮き彫りにしています。

元記事: https://www.bleepingcomputer.com/news/artificial-intelligence/openai-is-routing-gpt-4o-to-safety-models-when-it-detects-harmful-activities/

サイバーニュース.jp

OpenAI、GPT-4oの有害活動検出時に安全モデルへルーティングを実施

OpenAI、GPT-4oの有害活動検出時に安全モデルへルーティング

安全ルーティングのメカニズム

安全対策の目的と不可避性

セキュリティレポートの警告：パスワードクラッキングの増加

投稿をさらに読み込む

Netflixで視聴可能：「His House」：トラウマと恐怖が織りなす現代ホラーの傑作

Netflix、Warner Bros.買収前にホワイトハウス訪問：熾烈な買収合戦の舞台裏

X、EU委員会広告アカウントを停止：デジタルサービス法違反で1.2億ユーロの罰金に報復か

OpenAI、ChatGPT有料プランへの広告導入を否定 – ユーザーは「広告」と認識