英伟达涉版权诉讼案新进展:公司否认使用盗版书籍训练模型 法院将于2026年听证

在AI产业快速发展引发的版权保护争议中,英伟达与作家团体的诉讼纠纷成为业界关注焦点。

1月29日,英伟达向加州北区联邦法院提交驳回动议,对作家Nazemian等人提起的集体诉讼进行全面回应,否认曾利用盗版书籍进行AI模型训练。

这起名为"Nazemian v Nvidia"的案件源于2024年初,由多名作者联合提起。

原告方指控英伟达在开发AI工具和参考模型过程中,非法使用了受版权保护的书籍,这些书籍来自所谓的"影子图书馆",包括Anna's Archive和Books3等盗版资源库。

在修订版起诉书中,原告进一步补充了新的理论依据、数据集和模型指控,并援引英伟达员工的内部讨论记录作为关键证据,声称员工曾就是否能访问Anna's Archive进行确认。

英伟达在驳回动议中提出了多层次的法律论证。

首先,公司强调原告未能提供任何实质性证据证明其作品被下载或用于模型训练,现有指控纯属推测。

英伟达指出,原告没有提出具体事实来证明公司复制了其作品,也未说明复制发生的具体时间、方式或涉及的具体模型,这些都是版权侵权诉讼必须满足的基本要件。

围绕Anna's Archive这一核心争议点,英伟达提出了关键性辩论。

公司认为,即便起诉书描述了员工的内部讨论或对该网站访问可能性的询问,也不能等同于公司实际下载或获取了原告作品。

英伟达强调,讨论或评估潜在数据来源并不构成版权法意义上的复制行为。

版权侵权诉讼要求原告必须在起诉阶段就提出足以支持"复制受保护作品"的事实依据,而不能通过诉讼程序先行启动证据开示,再借此确认是否存在侵权。

英伟达还批评原告大量依赖"基于信息与信念"的表述方式,认为这种做法试图以取证程序替代起诉阶段应完成的事实陈述。

公司表示,在现有指控下,"合理的解释是英伟达并未获取原告作品"。

此外,英伟达试图缩小案件范围,反对原告在修订起诉书中新增的多个数据集与模型指控,包括对Megatron 345M等内容的讨论。

英伟达认为原告将多个模型与工具"打包式"指控,却没有解释任何特定模型如何使用原告作品进行训练。

公司还在动议中引用其公开文档,指出原告对训练数据来源的推断与公开资料存在矛盾。

这起诉讼反映了AI产业发展中的深层次问题。

随着生成式AI技术的广泛应用,关于训练数据来源的版权问题日益凸显。

一方面,AI企业需要大规模数据进行模型训练;另一方面,创意工作者的知识产权保护也不容忽视。

如何在两者之间找到平衡点,成为业界和法律界共同面临的挑战。

根据动议内容,该驳回请求预计将于2026年4月2日在美国加州北区联邦法院举行听证。

法官Jon Tigar将主持该案审理。

这一时间表意味着双方的法律争议将进入新的阶段,法院的最终裁决将对AI产业的数据使用规范产生重要影响。

这起围绕训练数据与版权边界的诉讼,表面是对“是否使用盗版图书”的事实之争,深层则是数字时代知识生产、技术创新与利益分配机制的再校准。

只有在更透明的合规体系、更可行的授权路径与更匹配技术特点的证据规则共同作用下,创新与保护才能从对立走向相互支撑,进而为创作者、企业与公众带来更可持续的长期收益。