NVIDIA 今天宣布推出一款工具,只需 30 分钟的音频数据,即可在一天之内打造类似真人的定制语音。
NVIDIA Riva 定制语音是 NVIDIA Riva 语音 AI 软件的一项功能,可助力呼叫中心开发定制语音,以及帮助开发者创建面向语言障碍人士的应用程序。
NVIDIA AI软件产品管理副总裁Kari Briski表示:“长期以来,模仿类似真人的互动一直是AI面临的一项巨大挑战,特别是对于那些具有行业术语的公司而言。现在,这些公司能够使用语音 AI 倾听客户,并且以他们品牌专属的、富有表现力的语音回复客户,推动更有趣味、更加愉悦的互动。”
最新版的 NVIDIA Riva 语音 AI 软件开发套件提供 Riva 定制语音。Riva SDK 包括先进的自动语音识别和文本到语音转换功能,可根据不同的口音和领域进行定制。它还能够将语音服务扩展到云、数据中心及边缘的数十万串流。
生态系统之声
在不到三年的时间里,NVIDIA 的对话式 AI 软件已实现 25 万次以上的下载量,在众多行业得到广泛应用。
RingCentral 是全球企业云通信、视频会议、协作和客服中心解决方案的优秀供应商,正在借助 Riva 自动语音识别提供视频会议实时字幕功能,打造更具吸引力的会议体验。
RingCentral 执行副总裁兼产品和工程总经理 Nat Natarajan 表示:“我们的目标是让会议更智能,现在借助 NVIDIA Riva,能够基于 NVIDIA GPU 训练实时转录模型,提高不同口音的准确性。未来,我们预计会有多个并发串流,Riva 可以轻松扩展,在 300 毫秒内实时处理这些串流。我们很高兴能与 NVIDIA 合作,一起展望未来。”
中国平安是全球最大的金融服务公司之一,正通过虚拟代理人来减少等待时间,改善客户体验。借助 Riva,它可以构建实时语音应用程序,不断提高准确性。
中国平安首席科学家肖京表示:“中国平安每天使用聊天机器代理人处理数百万客户查询。借助 NVIDIA 面向自动语音识别的预训练模型,在我们的数据上进一步微调,我们的系统在准确性方面提高了 5%,让我们能够提供更具吸引力、更加可靠的服务。”
此外,还有数十家软件制造商在生产中使用 NVIDIA 对话式 AI。Gosoft Contact Center 正在与 CP All 合作,后者拥有 20 多个业务领域,其零售领域在泰国涵盖 10000 多家 7-11 便利店。高度准确的 AI 语音机器人在泰语方面经过训练,每天总计可以帮助处理 24 万次呼叫。
Plabook Education 和 Data Monsters 正在与美国各地的学区合作,帮助孩子们学习通过 AI 数字虚拟形象阅读助理进行阅读,该助理可以帮助识别发音错误的单词并衡量其阅读准确性。
供货情况和定价
针对小型研发,NVIDIA Riva 在 NVIDIA NGC™ 容器仓库上免费提供。开发者可以加入 Riva 开放测试计划,立即试用软件并且接收相关功能更新通知。
对于具有大规模部署和寻求 NVIDIA 专家技术支持的客户,NVIDIA 还宣布 NVIDIA Riva 企业版计划,该计划预计将于明年初推出。
Riva亮相GTC
在GTC主题演讲中,NVIDIA创始人兼首席执行官黄仁勋展示了Riva的语音AI能力,其中包括在Riva自定义语音的演示中,展示了只需30分钟的数据就能创造出类似人类的新的声音。
Riva还通过Project Tokkio、DRIVE Concierge和Project Maxine在Omniverse Avatar(一个创建交互虚拟形象的平台)中得以展现。Project Tokkio和DRIVE Concierge展示了客户服务和车内环境中的虚拟形象,而Project Maxine则强调了实时翻译并转录到多种语言。
在GTC上,有二十多场专注于对话式AI的演讲,包括Hugging Face、Snap、T-Mobile等公司的演讲。演讲主题涉及开发和整合GPU加速的语音和语言AI应用等方面最先进的算法、工具、挑战以及效果等。