据彭博社当地时间周三报道,美国多名作家近日向纽约联邦法院提起诉讼,指控 Meta、微软等科技巨头未经许可使用他们的作品来训练 AI 模型。
这一作家团体周二提交了拟议集体版权诉讼,文件称 Meta 和微软采用了具有争议的“Books3”数据集来训练他们的大模型,告诉大模型如何回应人类的提示和指令。
IT之家注:作家团体声称,“Books3”数据集包含了成千上万本盗版书。
与此同时,AI 研究机构 Eleuther AI 也收到了指控,是因为该公司涉嫌向科技企业提供用于训练大模型的数据集,其中就包括了“Books3”。
报道称,“Books3”包含了从“影子图书馆”内获取的成千上万本书的文本内容,这一作家团体声称这些内容作为数据集的一部分,被滥用于训练 Meta、微软合作开发的 Llama 2 大模型中。由于上述公司从这些作家们的书籍中“以非法手段获取巨大价值”,因此作家团体向法院提出要求赔偿、下令禁止滥用他们的作品。
IT之家此前报道,上月末就有包括《权力的游戏》作者在内的 17 名作家向 OpenAI 提起诉讼,指控该公司的人工智能程序 ChatGPT“大规模地系统性盗窃”他们的版权作品,这是近期一系列作家对人工智能侵权问题的法律行动之一。