OpenAI首次展示音频模型Voice Engine，生成的声音太逼真了！

Aceryt

发布于 2024-4-1 15:21

浏览

0收藏

3月30日凌晨，OpenAI在官网首次展示了全新自定义音频模型“Voice Engine”。

用户只需要提供15秒左右的参考声音，通过Voice Engine就能生成几乎和原音一模一样的全新音频，在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。

除了能合成音频之外，OpenAI还展示了Voice Engine很多其他际商业用途，例如，一位失去声音表达能力的女孩，在Voice Engine帮助下能像以前一样正常发音说话。

Voice Engine功能展示

OpenAI并非展示了一些简单的demo，而是一些实际场景化用例，这也就是说Voice Engine的技术已经非常成熟。

Age of Learning 是一家儿童教育公司，他们一直在使用Voice Engine生成各种有声读物。同时还通过与GPT-4的相结合使用，创建实时、个性化的回答与学生互动。

例如，使用一段15秒的参考音频。就可以生成几乎一模一样的语音。

除了语音合成之外，Voice Engine还能提供视频翻译功能，可以将一种视频语音无差别的翻译成多国语言。

HeyGen是一家AI视频合成平台，主要帮助企业开发商品展示的“数字人”。他们通过使用Voice Engine进行视频翻译，扩展至多国语言来扩大全球覆盖受众。

输入一段原参考语音，就能将其转化成中文语音

帮助声音受损的人恢复声音：诺曼-普林斯生命科学研究所正在测试一项实验，正通过Voice Engine帮助那些因肿瘤或神经系统病因，导致语言障碍的患者恢复声音。

目前，他们已经帮助一位因血管性脑肿瘤，而失去流利语言表达能力的年轻女患者恢复了声音。

现在这位女患者可以正常与其他人交流了。

OpenAI表示，其实他们在2022年底便开发了Voice Engine，并将其用于支持文本到语音 API 中的预设语音以及 ChatGPT 的语音和朗读功能。

但出于安全考虑一直没有全面公测，目前也只是小范围测试。因为相比文本、视频，音频的造假能力太强了几乎无法分辨出来。

此外，OpenAI首席技术官Mira Murati在前不久接受的采访时表示，未来Sora生成的视频会带声音的，很可能为其提供声音的就是Voice Engine。

本文转自AIGC开放社区作者：AIGC开放社区

原文链接:https://mp.weixin.qq.com/s/ErMhYBEjjDMpJfPlj9NiIw

标签

AI 语音

相关推荐

音频驱动逼真人像动画合成！人人都是歌手！

angel • 3512浏览 • 0回复
OpenAI 推出语音引擎，只需15秒样本，即能重建任何人的声音

pangguiyu • 2115浏览 • 0回复
一张照片+音频=超逼真数字人视频！VASA-1模型拉开「实时交互」大幕

duhorse • 2345浏览 • 0回复
OpenAI首次公开前沿大模型安全：基础架构、保护措施等

Aceryt • 3976浏览 • 0回复
开源音频模型Stable Audio Open，文本生成47秒高清音效

Aceryt • 3603浏览 • 0回复
Stability AI开源47秒音频生成模型，虫鸣鸟叫、摇滚、鼓点都能生成

轻薄滴假象 • 2148浏览 • 0回复
太逼真了！Gen-3 Alpha重磅发布，Sora最强竞争对手！

Aceryt • 2429浏览 • 0回复
谷歌“另辟蹊径”，展示AI视频生音频最新进展，效果惊艳！网友：但有一个缺点

51CTO技术栈 • 2067浏览 • 0回复
耳朵没错，是声音太真了，字节豆包语音合成成果Seed-TTS技术揭秘

轻薄滴假象 • 2779浏览 • 0回复
旷视开源的AI人像视频生成太炸了！输入照片即可模仿任意表情包

轻薄滴假象 • 2397浏览 • 0回复
OpenAI展示草莓，很快发布“GPT-5”猎户座！

Aceryt • 1469浏览 • 0回复
Real-Time Voice Cloning：5 秒解锁声音克隆，凭啥斩获 52.9k Stars？

穿越时空111 • 3345浏览 • 0回复
NVIDIA AI 推出 Fugatto：一个 25 亿参数的音频模型，可从文本和音频输入生成音乐、语音和声音

Halo咯咯 • 1681浏览 • 0回复
FLOAT：基于流匹配的音频驱动说话者头像生成模型

angel • 1725浏览 • 0回复
击败99.9%的程序员！o3来了！AGI测试实现跃升！网友：推理scaling law太炸了！一文回顾OpenAI直播带货12天

51CTO技术栈 • 2435浏览 • 0回复
DeepSeek太给力了！自家的大模型秘方开源到底！国产大模型雄起

51CTO技术栈 • 1933浏览 • 0回复
马斯克阻止OpenAI营利化惨遭驳回！将秋季开庭判决；法官：收购提议太双标了！

51CTO技术栈 • 1177浏览 • 0回复
用 MCP 让大模型自动批量下载文献，太香了！

机器学习与数学 • 1911浏览 • 0回复
刚刚，OpenAI发布新文生图模型，免费、逼真到难以分辨

Aceryt • 808浏览 • 0回复

Aceryt

LV.7

这个用户很懒，还没有个人简介

觉得TA不错？点个关注精彩不错过

190

帖子

1666

声望

粉丝

关注

51CTO

51CTO博客

51CTO学堂

OpenAI首次展示音频模型Voice Engine，生成的声音太逼真了！

Voice Engine功能展示

目录