ChatGPT语音酷似「寡姐」遭炮轰！奥特曼紧急下架「Sky」-51CTO.COM

上周，OpenAI发布了ChatGPT的新对话界面，发布会现场，GPT-4o展现出了令人惊叹的语音效果，声音不仅极富表现力，而且能够体察工程师的情绪并给予安抚。

这种稍显「暧昧」的人机互动方式让众人惊呼——这简直是「Her」走进现实！

然而，这一次，有点走得太「近」了……

刚到周末，大家纷纷发现，ChatGPT的声音与「Her」中AI助手（斯嘉丽·约翰逊）的配音惊人地相似。

这再次引来媒体的大肆报道和公众的热议，而OpenAI也被指责为「窃取」斯嘉丽·约翰逊声音的盗贼。

《周六夜现场》上关于斯嘉丽·约翰逊的段子让整件事情达到了沸点

见大事不妙，OpenAI赶紧停用了这个名为「Sky」的合成语音。

与此同时，奥特曼也紧急发布声明表示：Sky的声音不是斯嘉丽·约翰逊的，也无意模仿她的声音。

「出于对约翰逊女士的尊重，我们已暂停在我们的产品中使用Sky的声音。我们对与约翰逊女士没有更好地沟通感到抱歉」。

但似乎已经为时已晚——「Sky」惹怒了「Her」。

寡姐在一份措辞激烈的声明中声称，在她拒绝为 ChatGPT 配音的邀请后，OpenAI仍然厚颜无耻地模仿了她独特的语气。

去年九月，我收到了一份来自Sam Altman的邀请，他希望我为当前的ChatGPT 4.0系统配音。他告诉我，他认为通过我的配音，可以弥合科技公司与创意人士之间的鸿沟，并帮助消费者在面对人工智能带来的巨大转变时感到舒适。他说他觉得我的声音会让人感到安慰。

经过深思熟虑，我因个人原因拒绝了这个邀请。九个月后，我的朋友、家人和公众都注意到新系统中「Sky」的声音非常像我。

当我听到发布的演示时，我感到震惊、愤怒和难以置信，Sam Altman竟然会追求一个听起来与我的声音如此相似的声音，以至于我最亲密的朋友和新闻媒体都无法分辨。Altman先生甚至暗示这种相似性是故意的，他在推特上发了一个字「Her」，这是对我在电影中为一个名为Samantha的聊天系统配音的引用，该系统与人类形成了亲密关系。

在 ChatGPT 4.0演示发布的前两天，Altman先生联系了我的经纪人，要求我重新考虑是否参加。在我们能够联系上之前，系统已经发布了。

由于他们的行为，我被迫聘请法律顾问，顾问向Altman先生和OpenAI写了两封信，详细说明了他们的行为，并要求他们解释创建「Sky」声音的具体过程。最终，OpenAI 不情愿地同意撤下「Sky」声音。

在我们都在努力应对深度伪造和保护自己形象、作品和身份的时代，我相信这些问题需要绝对的清晰。我期待通过透明度和适当的立法来解决这些问题，以帮助确保个人权利得到保护。

寡姐的这份声明称，在上周发布会的前两天，奥特曼联系了她的经纪人，要求她重新考虑与OpenAI合作的决定。看完发布会的演示后，她说她聘请了法律顾问写信 OpenAI，询问其如何制作新声音的详细信息。

除了「暂停使用」之外，OpenAI还发布了一篇博客文章，概述了创建声音的过程。

OpenAI称「我们认为人工智能声音不应该刻意模仿名人独特的声音——Sky的声音不是斯嘉丽·约翰逊的模仿，而是属于另一位专业女演员使用她自己自然说话的声音」。

然而，这并没有平息争议，OpenAI身陷舆论漩涡，变成了网友口中「偷走小美人鱼美妙歌声的邪恶反派乌苏拉」！

实际上，寡姐和OpenAI的「声音之争」并不是个例，在美国，类似的案例正在不断发生，AI公司正被创意工作者视为「声音窃贼」。

被下架的「Sky」

Sky并不是上周刚刚推出的新声音，而是OpenAI去年9月为ChatGPT提供的几种合成声音之一。

但在上周的发布会演示中，它表现出了更加逼真的语调和情感暗示。

在演示中，由名为GPT-4o的新AI模型驱动的ChatGPT版本似乎与OpenAI工程师调情，许多观众觉得这让人想起约翰逊在科幻电影「Her」中的配音表演。

尽管OpenAI首席技术官Mira Murati上周在接受The Verge采访时否认Sky有意模仿约翰逊，「与技术本身相比，它更多地反映了我们的想象力和我们的故事讲述能力」

「我们开发这项技术的方式并不是基于电影或科幻故事，我们正在尝试构建这些能够思考并对世界有深入了解的机器」。

不过，OpenAI CEO Sam Altman显然对「Her」这部电影情有独钟——

不仅在活动结束后立刻发布了只有「Her」这个单词的推文。而且还曾多次表示，斯派克·琼斯的「Her」是他最喜欢的电影，其中斯嘉丽·约翰逊为一位听起来很性感的虚拟助理配音。

估计奥特曼自己也没有想到，上周还引爆全网「科幻成真」的一则推文，怎么几天之后就变成了「呈堂证供」，被他喜欢的女演员挂在网上。

对于Sky的下架，有部分网友表示惋惜，因为他们认为，在ChatGPT可选5个声音中，Sky是最好用的那个。

「Sky是唯一可以说德语的声音。」

被指控的OpenAI

那么，ChatGPT的声音到底是如何选择的？OpenAI遭受的一切是误解吗？

据OpenAI发布的文章称「我们与业内领先的选角和导演专业人士合作，在筛选出5位配音演员之前，对400多份参赛作品进行了筛选」。

语音模式是ChatGPT最受欢迎的功能之一，用户可以听到五种不同的声音(Breeze、Cove、Ember、Juniper 和 Sky)，都是经过专业配音演员、艺人经纪公司、选角导演和行业顾问历时五个月的广泛讨论，精心挑选出来的。

但是为了保护他们的隐私，OpenAI拒绝透露配音演员的名字，只分享了声音的选择标准：

OpenAI特别强调，他们收到了超过400份参评作品，从14名演员的初步名单中选择了五个最终声音，并与演员讨论了他们对人机交互的愿景以及语音模式的目标，确保每个演员在投入该项目之前都了解语音模式的范围和意图。

新的ChatGPT语音助手功能将在未来几周内作为 ChatGPT Plus用户的有限「alpha」版本推出。OpenAI计划引入更多声音，以「更好地匹配用户的不同兴趣和偏好」。

无奈的是，与约翰逊的冲突加剧了OpenAI与艺术家、作家和其他创意人员的现有斗争。

OpenAI已经在为多起指控其不当使用受版权保护的内容来训练算法的诉讼进行辩护，其中包括《纽约时报》和乔治·R·R·马丁等作者的诉讼。

被AI窃取的人们

在偷走小美人鱼歌声这件事上，OpenAI并不是唯一的「乌苏拉」。

配音演员Linnea Sage和Paul Lehrman正在起诉一家人工智能公司Lovo，指控其在未经他们许可的情况下克隆了他们的声音。

Lovo是一家总部位于加利福尼亚州伯克利的科技公司，宣传人工智能生成的语音技术可用于营销、教育和产品演示。

配音演员Linnea Sage和Paul Lehrman

配音演员Paul Skye Lehrman在2020年接受了一份工作，他认为自己为此提供了一组一次性的声音样本。

多年后，他说他听到自己的声音在YouTube视频和播客上进行旁白——尽管他从未录制过其中任何一个视频。

同样是配音演员的Sage在2019年也从同样的求职网站上接到了广播广告测试的工作，对方告知语音素材都不会对外泄露，后来Sage在Lovo公司展示其技术的Youtube影片中发现了自己的声音。

两起事件的共通点，就是在求职网站上发案子给配音演员的正是Lovo的员工，让Lehrman和Sage坚信自己的语音样本在未经同意的情况下被盗用，而顾客从Lovo购买到窃取声音的产品都将被视为「赃物」。

现在，Lehrman和Sage一起起诉人工智能公司Lovo，指控其以虚假借口委托他们进行语音项目，以创建和销售人工智能生成的声音版本。

他们正在寻求超过500万美元的赔偿，要求法庭命令阻止Lovo继续使用他们的声音。并寻求集体诉讼地位，以联合其他「声音和/或身份被窃取和使用」的人。

配音演员的诉讼只是最近创意人员、作家和艺术家对多家科技公司提起的一系列法律诉讼中的一起，此类诉讼加剧了人们对人工智能模型训练可能违反版权和知识产权法的担忧，因为人工智能模型需要大量数据。

OpenAI与约翰逊的这场争议既非开始，也非结束，我们每个人都与目前发生的这一切相关，关于我们如何看待与AI系统形成的情感联系，也关于我们自身的声音/身份该被如何使用。

科幻电影提供了关于这些问题的想象，可并非答案。因为「Her」，这部电影的主角并不幸福。