はじめに
Googleの最新AIモデル「Nano Banana Pro」が、驚くほどリアルな画像を生成し、大きな注目を集めています。特にその特徴は、あたかもスマートフォンで撮影されたかのような自然さにあり、これまでのAI生成画像に見られた不自然さが薄れ、非常に説得力のある仕上がりになっていると報じられています。
リアルさを生む「不完全さ」
記事によると、Nano Banana Proが生成する画像のリアルさの秘訣は、むしろその「不完全さ」にあると言います。例えば、都市の風景では街灯がわずかに不自然に見えたり、遠景の建物がブロック状に見えたりすることがあります。しかし、こうした細かな「粗」が、SNSなどで見かける普通のスマホ写真の特徴と重なり、AIが生成したものであると見破られにくくしています。
スマートフォン写真の再現性
人気iPhoneカメラアプリ「Halide」の共同創設者であるベン・サンドフスキー氏も、Nano Banana Proのリアルさを指摘しています。彼は、画像に現れる明るく平坦な露出、広い被写界深度、わずかにざらついたディテール、そして「積極的な画像シャープネス」が、スマートフォンの写真によく見られる特徴だと述べています。また、AI生成画像では珍しく、スマホの小さなセンサーから来るような「ノイズ」の質感も再現されていることが、リアリティを一層高めているとのことです。
リアルさの源泉
では、Nano Banana Proはどのようにしてこれほどまでにリアルな画像を生成しているのでしょうか。Googleの広報担当者によると、このモデルはGoogle Photosのデータを利用しているわけではなく、特定の「スマホ写真ルック」を目指して開発されたわけでもないとのことです。しかし、Nano Banana ProはGoogle検索に接続し、テキスト情報を取得する能力を持っています。これにより、プロンプトに明示されていない文脈に応じた詳細(時代に合った服装や車、不動産物件の透かしなど)を画像に自動的に追加する能力が向上しています。時には「ハルシネーション(幻覚)」として認識されるような、古いロゴや透かしが追加されることもありますが、それがかえって画像の説得力を増す結果につながっているといいます。
AIが作り出す「偽りの現実」の懸念
このようなAIの進化は、私たちに新たな懸念を抱かせます。AIが生成した画像と本物の写真を見分ける手がかりが、ますます見つけにくくなっているからです。記事は、以前はAIが生成した画像には不自然な指の数や文字の誤りなど、明らかな「AIの痕跡」があったものの、Nano Banana Proではそうした特徴がほとんど見られないと指摘しています。これにより、私たちがオンラインで目にする写真や動画の信頼性が揺らぎ始めています。著者は、「AIのサインを見つけるのが難しくなり、イメージが本物に見える小さなディテールを模倣することにAIが長けている」と述べ、「信じるべきでない写真や動画を判断する日は、もはや未来ではなく、今ここにある」と警鐘を鳴らしています。
元記事: https://www.theverge.com/report/837971/google-nano-banana-pro-realistic-phone-photos
