概要:AdobeのAI戦略に影を落とす著作権訴訟
Adobeは、同社のAIモデル「SlimLM」の学習に著作権を侵害した可能性のある書籍データを使用したとして、集団訴訟の提案に直面しています。この訴訟は、オレゴン州の作家エリザベス・ライオン氏によって提起されました。彼女は、自身の著作物を含む海賊版の書籍がAdobeのAIトレーニングデータに無断で使用されたと主張しています。
訴訟の詳細と背景にあるデータセットの問題
ライオン氏の訴状によると、AdobeのSlimLMは、Cerebrasが2023年6月に公開したオープンソースのデータセット「SlimPajama-627B」で事前学習されました。このSlimPajamaデータセットは、先行する「RedPajama」データセットをコピー・操作して作成されており、その中には膨大な書籍コレクション「Books3」も含まれているとされています。ライオン氏は、自身の著書が、このように操作されたデータセットを通じてAdobeの学習プロセスに組み込まれたと主張しています。
「Books3」は191,000冊もの書籍を含む巨大なコレクションであり、これまでにも多くの生成AIシステムのトレーニングに使用されてきました。しかし、その著作権の取り扱いを巡っては、AI業界で継続的な法廷闘争の火種となっており、今回の訴訟もその一環と見られています。RedPajamaデータセットも、過去の複数の訴訟で問題視されています。
広がるAI学習データと著作権問題
AIモデルが膨大なデータセットでトレーニングされる現代において、著作権侵害を巡る訴訟は珍しいものではなくなりました。2025年9月には、Appleが自社のAIモデル「Apple Intelligence」の学習に著作権のある素材を無断で使用したとして訴えられました。また、10月にはSalesforceもRedPajamaデータセットの使用に関して同様の訴訟に直面しています。
最も注目すべき事例としては、Anthropicがチャットボット「Claude」の学習に海賊版の著作物を使用したとして提訴された件が挙げられます。Anthropicはこの訴訟で、作家側と15億ドルという巨額の和解金で合意に至りました。この和解は、AI学習データにおける著作権侵害問題の法廷闘争において、重要な転換点となる可能性を秘めていると見られています。
今後の展望
今回のAdobeへの訴訟は、AI技術の急速な発展がもたらす新たな法的課題を浮き彫りにしています。AI開発企業は、著作権で保護されたコンテンツの利用に関して、これまで以上に慎重な対応と透明性が求められることになるでしょう。これらの訴訟の結果は、今後のAI業界におけるコンテンツ利用のあり方に大きな影響を与える可能性があります。
