Microsoft、初の自社製AI画像生成モデル「MAI-Image-1」を公開
Microsoftは、初の自社開発AI画像生成モデル「MAI-Image-1」を正式に発表しました。このモデルは、現在「Bing Image Creator」および「Copilot Audio Expressions」の2つの製品で利用可能です。昨年10月に発表されて以来、その性能に注目が集まっていましたが、ついにユーザーの手に届くことになります。
Microsoft AIの責任者であるムスタファ・スレイマン氏は、MAI-Image-1が特に食品や自然の風景、芸術的な照明、そしてフォトリアルなディテールの生成において「非常に優れている」とX(旧Twitter)で述べています。同社は、このモデルが「より大きく、より遅いモデルと比較しても、フォトリアルな画像生成、特に照明(バウンスライト、反射など)や風景において優れている」と強調しており、高速性と高品質の組み合わせにより、ユーザーはアイデアを素早く形にし、迅速に反復作業を行うことができるとしています。
EUでの展開と規制への対応
MAI-Image-1のリリースは大きな一歩ですが、現時点では欧州連合(EU)ではまだ利用できません。スレイマン氏は、EUでの提供が「近日中」であることを示唆していますが、具体的な時期は不明です。これは、EUが厳格なデータプライバシー規制(GDPR)や、今後施行されるAI規制(AI Act)を導入していることを考慮すると、コンプライアンスとセキュリティに関する慎重な対応が求められている可能性を示唆しています。AI生成コンテンツの透明性や悪用防止策など、EUの規制要件を満たすための準備が進められていると推測されます。
MAI-Image-1の技術的特徴と応用
MAI-Image-1は、単なる画像生成にとどまらず、Copilotのテキスト読み上げプラットフォームである「Copilot Audio Expressions」の「ストーリーモード」において、AI生成オーディオストーリーに付随するAI生成アートを作成する役割も担います。これにより、より豊かで没入感のあるコンテンツ体験が提供されることが期待されます。
AI戦略の転換と競合モデル
Microsoftはこれまで、OpenAIのモデルに大きく依存してきましたが、MAI-Image-1の登場は、同社のAI戦略における重要な転換点となる可能性があります。昨年8月には、自社製AIモデルとして音声モデル「MAI-Voice-1」とテキストベースモデル「MAI-1-preview」を発表しており、OpenAIモデルへの依存からの脱却を示唆していました。
現在、MicrosoftのCopilotチャットボットはOpenAIの最新モデル「GPT-5」への移行を進めているほか、Anthropicの「Claude AI」モデルもオプションとして提供しています。Bingの画像クリエーターウェブサイトおよびアプリでは、MAI-Image-1に加え、OpenAIの「DALL-E 3」と「GPT-4o」も利用可能であり、ユーザーは複数の高性能AI画像生成モデルから選択できるようになっています。
元記事: https://www.theverge.com/news/813789/microsoft-in-house-ai-image-generator-mai-image-1
