Microsoft Azure、グローバル規模の障害でクラウドサービスが世界的に停止

概要

2025年10月9日木曜日、Microsoft Azureは大規模なサービス停止に見舞われ、世界中の多くの顧客がクラウドサービスにアクセスできない状況となりました。この障害は、クラウドインフラストラクチャへの依存度が高まる現代において、その脆弱性を浮き彫りにする出来事となりました。

障害の詳細

今回のインシデントは、UTC午前7時40分頃に発生しました。原因は、Azureのネイティブコンテンツデリバリーネットワーク(CDN)であるAzure Front Doorの容量が約30%低下したことにありました。Azure Front Doorは、WebアプリケーションやAPIの安全なグローバルエントリーポイントとして機能し、エッジサーバーの最適化されたネットワークを通じてトラフィックをルーティングすることでパフォーマンスを向上させる役割を担っています。この中核コンポーネントが機能不全に陥ったことで、ユーザーは頻繁な接続障害に直面し、Azure Portalを通じたサービス管理も不可能となりました。

影響範囲とユーザーへの影響

Microsoftのサービスヘルスステータスページによると、障害は特に以下の地域に集中しました。

  • 北ヨーロッパ
  • 西ヨーロッパ
  • フランス中央
  • 南アフリカ西部
  • 南アフリカ北部

これらの地域では、Webサイト、モバイルバックエンド、アプリケーションプログラミングインターフェース(API)で断続的なサービス中断が発生しました。Eコマースサイトではカート機能が停止し、リアルタイムメッセージングサービスではメッセージ配信が失われ、データパイプラインは滞り、時間制約のある分析タスクに影響を与えました。多くの顧客がソーシャルメディアで不満を表明し、アプリケーションのバックエンドが稼働していても、「フロントドア」の機能不全によりエンドユーザーがサービスに到達できない状況を指摘しました。即座の収益損失に加え、一部の組織はサービスレベル契約(SLA)の未達による潜在的な契約違反や評判の損害に直面しました。開発者コミュニティからは、公開されている障害だけでなく、Azure Portalにアクセスできないため迅速な回避策を講じられないことへの不満の声が上がりました。

Microsoftの対応

障害発生から数分以内に、Microsoftは公式チャネルおよびX(旧Twitter)のAzureサポートアカウントを通じて問題を認識しました。エンジニアは直ちに調査を開始し、影響を軽減するために一時的なトラフィック再ルーティングを実施しました。UTC午前10時14分までに、Microsoftは最近のソフトウェア展開が障害の引き金ではないと判断し、より深いインフラストラクチャの問題を示唆しました。同社は、1時間ごとの更新を提供し、影響を受けた顧客に対しては、サブスクリプションや環境の詳細を収集するための直接的な支援を約束しました。また、根本原因の調査結果と、同様の事態を防ぐためのアーキテクチャ変更を詳述する事後分析を実施することも約束しました。

教訓

今回のインシデントは、いかに堅牢なクラウドプラットフォームであっても、CDNのような単一のコンポーネントが障害を起こした場合に脆弱性が露呈することを浮き彫りにしました。ビジネスが統合されたクラウドサービスに大きく依存し続ける中で、多地域冗長性と、重要な管理インターフェースへの代替アクセスパスの確保が極めて重要であることを改めて認識させる出来事となりました。


元記事: https://gbhackers.com/microsoft-azure-experiences-global-outage/