1 月 17 日消息,据彭博社报道,在当地时间周二的达沃斯世界经济论坛年会上,OpenAI 首席执行官萨姆・阿尔特曼在回应有关其公司盗用版权材料的指控时表示,AI 并不需要《纽约时报》等新闻出版商提供大量的训练数据。
有些人认为,“你需要我所有的数据进行训练,我的数据非常有价值。”事实上,情况一般并非如此,例如我们并不想利用《纽约时报》的数据进行训练。
阿尔特曼还表示,公司的很多研究都是如何从少量、高质的数据中学习到更多东西。
在《纽约时报》起诉 OpenAI 和微软之后,OpenAI 正在大力推动新闻内容的访问许可。彭博社上周曾援引知情人士消息称,OpenAI 正在与包括 CNN、福克斯公司和时代周刊在内的出版商洽谈新闻内容授权事宜。该公司的知识产权和内容主管此前告诉彭博社,公司正在进行数十项潜在的授权交易。
阿尔特曼这次透露了自己仍希望与出版商合作的意愿:“如果出版商愿意的话,我们希望能跟他们合作。例如当我们的用户询问‘今天达沃斯发生了什么’的时候,我们(的应用)就可以说,这是来自彭博社的一篇文章,这是来自《纽约时报》的一篇文章。有人愿意与我们合作,但有人不愿意。”
IT之家附前情提要:
去年 12 月 27 日,《纽约时报》在曼哈顿联邦地区法院对 OpenAI 和微软发起诉讼,声称对方公司“未经授权而使用了数百万”文章来训练其 AI 模型,导致其 AI 生成的内容现在会与《纽约时报》的内容“直接竞争”。
纽约时报声称,为 ChatGPT 提供技术支持的大语言模型 (LLM)“可以生成逐字背诵的《纽约时报》内容,对其进行总结并模仿其表达风格进行输出”,这“破坏了”它与读者之间的关系,同时也剥夺了其“订阅、许可、广告和附属收入”。