两大权威百科出版社起诉 OpenAI 侵犯版权
Encyclopedia Britannica(不列颠百科全书)和 Merriam-Webster(韦氏词典)已向法院提起诉讼,指控 OpenAI 犯下“大规模版权侵权”行为。
未经授权抓取内容用于训练
Britannica 集团拥有近 10 万篇在线文章的全部版权。诉讼指控 OpenAI 在未经许可的情况下抓取这些文章,用于训练其大型语言模型。原告认为,此举严重侵犯了内容创作者的合法权益。
RAG 工作流中的直接复制
诉讼还指出,OpenAI 在生成回答时包含对其内容的“完全或部分逐字复制”,这同样违反了版权法。此外,OpenAI 将 Britannica 的文章用于 ChatGPT 的 RAG(检索增强生成)工作流——即大语言模型在回答用户问题时扫描网页或其他数据库以获取最新信息的功能。 Britannica 进一步指控 OpenAI 违反了《兰纳姆法》(Lanham Act,商标法规),因为 ChatGPT 会生成虚假幻觉内容并错误地归因于该出版商。
营收流失与信任危机
诉讼文件指出:“ChatGPT 通过生成回答来替代并直接与 Britannica 等出版商的内容竞争,导致网络出版商失去收入来源。”Britannica 还指控 ChatGPT 的幻觉内容正在“危及公众获取高质量、可信赖在线信息的渠道”。
批量诉讼再添一员
Britannica 是最新加入起诉 OpenAI 行列的出版商。此前已有:
- 《纽约时报》
- Ziff Davis(旗下拥有 Mashable、CNET、IGN、PC Mag 等媒体)
- 美国和加拿大超过十几家报纸,包括《芝加哥论坛报》《丹佛邮报》《太阳哨兵报》《多伦多星报》及加拿大广播公司
此外,Britannica 对 Perplexity 提起的类似诉讼仍在审理中。
法律先例尚未明朗
目前尚无明确法律先例判定使用版权内容训练 LLM 是否构成侵权。不过在一起相关案件中,Anthropic 成功说服联邦法官威廉·阿尔苏普(William Alsup),认为将内容用于训练数据属于“转换性使用”。但阿尔苏普同时判定,Anthropic 通过非法下载数百万本图书(而非付费购买)违反了法律,最终导致一笔 15 亿美元的集体诉讼和解。


评论