近日,美国加州北区联邦地区法院作出最新司法裁定,正式驳回英伟达要求撤销集体版权诉讼的动议,这起案件被誉为业内“AI训练数据版权第一案”,备受科技界与版权领域关注。

该案由多名作者联合发起,核心控诉直指英伟达:其涉嫌使用含19.7万本盗版电子书的Books3数据集,通过旗下NeMo Megatron AI框架训练大语言模型,严重侵犯作者合法著作权。据悉,该盗版数据集被整合进超800GB的开源文本数据集The Pile,最终接入相关框架用于模型训练。

庭审中,英伟达援引美国版权法“安全港”条款及相关判例抗辩,声称NeMo框架是通用AI训练工具,存在大量合法用途,请求驳回诉讼。但法官明确驳回全部抗辩,指出争议核心并非框架本身,而是其内部特定数据处理脚本,这些脚本唯一用途就是加速侵权,与通用工具存在本质区别。

此外,英伟达还被指控向多家客户分发自动下载侵权数据集的脚本,为第三方侵权提供支持。目前案件正式进入证据开示环节,后续将推进庭审,下次听证会日期尚未公布。有网友调侃道,“这是在阻止天网的诞生”。对此,你怎么看呢?欢迎在评论区留言讨论。