AI“读书”合法了:美法院最新裁定,无需作者同意,已购书籍可用于训练AI

AI快讯 2025-06-26
在人工智能蓬勃发展的当下,AI 训练数据的版权问题一直备受关注。近日,美国法院的一项最新裁定引发热议:允许 Claude 背后的公司 Anthropic 在未经作者许可的情况下,使用合法购买的已出版书籍训练 AI。这一裁定参考了美国版权法中的 “合理使用”(Fair Use)原则,认为 AI 训练属于 “转化性使用”(Transformative Use),即对原作品的新用途未取代原作市场,且有利于技术创新和公共利益。这是美国法院首次认可 AI 公司对书籍的使用权,大大降低了 AI 训练数据的版权风险。

案件回溯:版权争议的缘起

这起诉讼由三位作家于 2024 年 8 月发起,指控 Anthropic 非法复制作品(包括盗版和扫描版)用于训练 AI,侵犯版权。争议的焦点在于 Anthropic 在训练 Claude 模型时,使用了大量书籍,而这些书籍的来源和使用方式存在诸多问题。


2021 年,Anthropic 的联合创始人 Ben Mann 从盗版网站下载 19.6 万本受版权保护的书籍。到 2022 年,Anthropic 又从 LibGen 和 PiLiMi 下载了 “至少 500 万份拷贝(copies)” 和 “200 万份拷贝”,建立数字化图书馆。尽管意识到盗版的法律风险,Anthropic 仍保留所有盗版副本。直到 2023 年 3 月,Anthropic 从数字化图书馆选择书籍子集训练 Claude 模型,并发布了 Claude 首版。2024 年 2 月,Anthropic 雇佣前 Google 图书扫描项目负责人 Turvey,转向合法采购并扫描书籍,购买数百万本纸质书,但 Turvey 与出版商的沟通并未持续跟进。

法院裁定:厘清界限,区别对待

美国法院在此次裁决中明确,AI 公司可未经原作者许可使用合法购买的书籍训练 AI。法院认为 AI 训练具有 “高度转化性”,未直接替代原作市场,且输出未侵犯原告作品,因此 Anthropic 使用合法采购书籍的扫描副本用于训练 AI 的数据处理是被允许的。但法院同时裁定,盗版书籍的使用不构成合理使用,盗版行为本身涉及侵权,盗版相关责任及赔偿问题需进入审判阶段。简单来说,关键在于训练使用书籍的来源是不是盗版。


这一裁定意味着此后 AI 可以研究其购买而非从盗版网站获取的内容。有网友认为这是一个正确的决定,类比人类读书学习,AI “读书” 理解也应合理;但也有人提出质疑,AI 与人类能一概而论吗?创作者的知识又该如何保护?

类似案例:多起诉讼,各有裁决

在 AI 发展历程中,类似的版权诉讼并非个例。


  • 2015 年 Google Books:2004 年,Google 开启 “Google’s Library Project”,与各大图书馆合作扫描并数字化超两千万册图书,包括公有作品和版权期内的书籍。Google 对不同作品的处理方式不同:公有作品提供全文浏览和下载;版权期内作品仅提供书目、简介、少数章节内容及购买链接 。2005 年,美国作家协会等机构起诉 Google,认为其行为侵犯版权。2013 年,美国联邦法院一审驳回原告诉求,认定 Google 的搜索和片段浏览功能转化了原作用途,构成合理使用;2015 年,二审维持原判。
  • 2022 年 GitHub Copilot:GitHub Copilot 是微软旗下 GitHub 开发的 AI 编程助手,基于 OpenAI 的 Codex 模型,通过分析公开代码库生成代码建议。2022 年,多名开源开发者及组织指控其存在许可证违规、版权侵权、商业滥用等问题。法院认定 AI 训练使用开源代码属于 “转化性使用”,不构成直接侵权;同时要求 GitHub 加强过滤机制,避免输出受特定许可证约束的代码,或明确标注来源及许可证要求,并提供代码相似性检查工具。2023 年 2 月,GitHub 发布 “代码来源检测” 功能。
  • 2023 年 OpenAI&Meta:2023 年,多名作家、演员以及全球出版商联盟指控 OpenAI 和 Meta 使用盗版数据训练 AI,数据来自 “影子图书馆”。ChatGPT 能准确总结原告书籍内容,Meta 被指明知 LibGen 为盗版仍用其数据训练 Llama 3。目前该案件仍在受理中,尚未有明确裁决。


本次 Anthropic 案的胜诉并非偶然,这体现了美国司法系统在 “技术创新 vs. 版权保护” 的权衡中,倾向于支持技术创新的态度。这也是美国首次有法院依据合理使用原则,保护人工智能公司在使用受版权保护的文本训练大语言模型(LLMs)时不受限制。不少人认为,本次裁决结果可能会影响美国法院对 OpenAI 和 Meta 案件的审理,为未来 AI 领域的版权纠纷处理提供重要参考。
©️版权声明:若无特殊声明,本站所有文章版权均归AI工具集原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。

相关文章