只需3kbps就能清晰通话,这个谷歌音频工具开源了

新闻 开发工具
Lyra是谷歌公司推出的一款不惧低带宽的音频编解码器,用来实现随时随地高质量通话。

 [[392576]]

 本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

3kbps也能清晰通话的神器Lyra,开源了!

Lyra是谷歌公司推出的一款不惧低带宽的音频编解码器,用来实现随时随地高质量通话。

3kbps是什么概念?

换算成生活中常见的单位,等于0.375KB/s

对比来看更加直观,Skype官网给出的通话最低速度是30kbps,带宽要求整整高出了10倍

只需3kbps就能清晰通话,这个谷歌音频工具开源了

Lyra利用机器学习模型,将原始音频压缩到3kbps,即使没有高速网络,也能得到自然清晰的语音。

它的架构与传统的编解码器类似,分为编码器和解码器两部分:

只需3kbps就能清晰通话,这个谷歌音频工具开源了

编码器以40毫秒为单位,从语音中提取特征,进行压缩后通过网络传输。

解码器利用机器学习模型,能使用最少的数据量重建语音,将特征转换成完整的音频波形,以进行播放。

带宽要求低、效果更好

在Lyra之前,音频编解码器的比特率越低,语音的清晰度就越差,并且机械感越重。

传统的音频编解码器使用的是数字信号处理技术,而Lyra则依赖其强大的信号重建能力

由于Lyra无需逐个处理信号,因此无需高带宽,而且在保持低比特率的同时,还能提供高质量的音频输出。

只需3kbps就能清晰通话,这个谷歌音频工具开源了

谷歌还使用Lyra与Opus、Speex,在6kbps和3kbps的情况下,对同一音频的压缩质量进行对比测试

结果显示:

3kbps的情况下,Lyra性能优于现有的其他编解码器;

8kbps的情况下,其性能优于Opus,同时降低了超过60%的带宽;

甚至,Lyra在3kbps情况下的语音清晰度,也优于6kbps情况下的Opus。

只需3kbps就能清晰通话,这个谷歌音频工具开源了

谷歌公司认为Lyra可能有广泛的应用前景,比如:降低音频文件大小,以存储大量语音;节省手机电量;以及缓解网络拥堵等。

已在GitHub开源

现在,Lyra已经在GitHub上开源。

只需3kbps就能清晰通话,这个谷歌音频工具开源了

Lyra使用Bazel构建框架,并且使用C++编写代码,以保证速度、效率和可操作性。

这一版本支持用户在Linux上开发和调试,还针对64位ARM Android平台进行了性能优化,使它不仅能在云服务器上运行,而且还可以在手机上实时运行和训练。

此外,Lyra还为开发人员提供了编码和解码所需的工具。

谷歌工程师Andrew Storus和Michael Chinen表示:

“很高兴看到开源社区的创造力能体现在Lyra上,以开发更多独特和有影响力的应用。”

 

 

责任编辑:张燕妮 来源: 量子位
相关推荐

2021-05-18 11:40:11

开源脚本工具

2020-08-14 10:44:34

谷歌开源工具

2021-01-27 11:36:34

代码开发工具

2020-06-30 14:55:43

飞信WiFi运营商

2021-04-21 10:27:17

JavaScript代码项目

2016-12-20 13:35:52

谷歌开源项目

2022-06-07 09:58:48

Spotify开源音频文件

2017-11-03 17:05:11

开源

2023-01-10 14:25:24

微软AI

2020-03-30 15:20:56

Java开发代码

2021-06-28 10:06:21

开源文本识别pyWhat

2023-02-20 10:16:20

ChatGPT模型

2018-06-11 15:20:24

2020-02-11 20:00:29

开源开源工具天气预报

2023-04-18 18:22:31

开源工具数据库

2020-03-12 14:19:49

AI 数据人工智能

2018-09-27 11:25:07

开源日志聚合

2010-08-31 08:59:52

Gmail网络通话

2012-08-30 11:25:45

开源平台谷歌Drill

2024-03-28 13:14:00

数据训练
点赞
收藏

51CTO技术栈公众号