被指在 AI 训练中滥用盗版书籍,Adobe 面临集体诉讼

一项由作家 Elizabeth Lyon 发起的集体诉讼对Adobe发出新的指控,称对方在训练 SlimLM 语言模型时,使用了包括 Lyon 本人的作品在内的大量盗版书籍。Lyon 来自俄勒冈州,长期从事非虚构写作,并出版多本写作指导类书籍。

被指在 AI 训练中滥用盗版书籍,Adobe 面临集体诉讼

12 月 18 日消息,据外媒 TechCrunch 今日报道,一项由作家 Elizabeth Lyon 发起的集体诉讼对 Adobe 发出新的指控,称对方在训练 SlimLM 语言模型时,使用了包括 Lyon 本人的作品在内的大量盗版书籍。Lyon 来自俄勒冈州,长期从事非虚构写作,并出版多本写作指导类书籍。

Adobe 方面介绍,SlimLM 是一套面向移动设备文档辅助场景的小语言模型,其预训练基础为 SlimPajama-627B 数据集。该数据集由 Cerebras 于 2023 年发布,被描述为去重、多语料的开源集合。然而诉讼认为,SlimPajama 本身来源存在问题。

诉讼文件指出,SlimPajama 是在复制并加工 RedPajama 数据集的基础上生成的,而 RedPajama 包含广受争议的 Books3 数据集。Books3 收录约 19.1 万本书籍,其中包含大量受版权保护作品。

诉讼明确指出,作为 RedPajama 的派生数据集,SlimPajama 同样包含 Books3 内容,因此不可避免地纳入了原告及其他作者的版权作品。

围绕 Books3 和 RedPajama 的争议,早已不止于 Adobe。此前,苹果和 Salesforce 均因涉嫌在 AI 训练中使用相关数据集而遭到起诉,相关案件指控企业未经授权使用受版权保护内容。

在更广泛的行业背景下,类似诉讼正在成为常态。AI 模型对训练数据规模的高度依赖,使数据来源问题频频引发法律风险。今年 9 月,Anthropic 同意向多名作者支付 15 亿美元(注:现汇率约合 105.77 亿元人民币),就其训练 Claude 时使用盗版作品的指控达成和解。该案件被外界视为 AI 训练版权争议的重要节点,然而行业内持续扩大的法律挑战仍未终结。

THE END
免责声明:本文版权归原作者所有;旨在传递信息,不代表鲸媒智集的观点和立场。
相关阅读
  • Venngage AI:轻松设计引人注目的书籍封面

    Venngage AI:轻松设计引人注目的书籍封面

    对于任何作者或内容创作者来说,书籍封面都是至关重要的营销工具。一个引人注目的封面能够立刻吸引潜在读者的注意力,传达书籍的主题和风格,并最终促使他们购买或阅读。

    2025年12月19日 8:55
  • Adobe Firefly 更新:说句话就能修改视频元素、镜头角度

    Adobe Firefly 更新:说句话就能修改视频元素、镜头角度

    Adobe 为其 AI 视频生成应用 Firefly 推送更新,新增基于文本指令精准编辑的视频编辑器,并引入多款第三方模型。用户现在可以更灵活地调整视频元素、色彩及镜头角度,还能提升视频分辨率至 4K。#AdobeFirefly #AI视频编辑

    2025年12月17日 10:25

栏目精选