DingDong智能音箱:听见科技的声音

企业动态
在今年首届亚洲消费电子展(International CES Asia)上,京东智能与科大讯飞联手推出了首款产品——DingDong智能音箱,一经发布便引起了业界的普遍关注。其不仅开创了一种崭新的语音交互方式,同时也是一款具有入口级战略意义的智能产品。语音交互一直是人类探索人机交互的下一步场景。这种场景让我们可以彻底解放双手,如果你认为这种情况还只能出现在科幻电影里,那不妨看看京东智能与科大讯飞是如何让科幻照进现实的。

在今年首届亚洲消费电子展(International CES Asia)上,京东智能与科大讯飞联手推出了首款产品——DingDong智能音箱,一经发布便引起了业界的普遍关注。其不仅开创了一种崭新的语音交互方式,同时也是一款具有入口级战略意义的智能产品。语音交互一直是人类探索人机交互的下一步场景。这种场景让我们可以彻底解放双手,如果你认为这种情况还只能出现在科幻电影里,那不妨看看京东智能与科大讯飞是如何让科幻照进现实的。

自由之声:麦克风远场识别技术

语音交互想要做到智能化,首先是要在场景的使用上足够自由,也就是说,不论你在客厅的哪个角落发出指令,设备都能够准确的识别。想要做到这样一种体验,它所涉及的是多种复杂的语音交互处理。

目前室内的语音交互受到背景噪音、其他人声干扰、回声、混响等多重复杂因素影响,导致识别率极低,甚至无法使用,只能在相对安静、近距离的环境下使用。为了能够打破这种限制,科大讯飞为DingDong智能音箱提供了远场识别技术,使语音交互的距离可以达到5米且保证识别率在90%以上,这也是目前市场上唯一支持5米的超远距离语音交互产品。

该技术利用安放在音箱顶部的8个麦克风阵列,实现空间上360°的语音信号采集,通过声源定位来确定目标说话人的方向。同时,利用麦克风阵列形成的空域滤波特性,在目标说话人方向形成拾音波束,抑制波束之外的噪音和反射声,此外,结合独特的去混响算法,***程度的吸收反射声,从而达到去混响的目的。

 

细心设计的结构与精密的算法结合,将目标声源方向之外的噪声或干扰抑制10dB以上,很好的保障了DingDong智能音箱的语音识别率。

在排除了外部干扰之后,音箱本身所发出的声音,如何不变成干扰,使用户可以在播放过程中进行唤醒和打断,DingDong智能音箱采用了基于多通道回声消除的语音打断技术,通过多通道回声消除和麦克风阵列技术的结合,实现音箱在播放100dB的音乐时,可以做到90%的语音唤醒率。

聆听之声:语音识别技术

在解决了远距离语音交互的混响和噪音问题后,“语音识别”便成了决定这款音箱是否智能的关键。“语音识别”技术相当于给计算机系统装上“耳朵”,使其具备“能听”的功能。该技术经过语音信号处理、语音特征处理、模型训练及解码引擎等复杂步骤,使机器最终能够将语音中的内容、说话人、语种等信息识别出来。

为此科大讯飞将深度神经网络技术引入到了语音识别当中。通过海量训练语料基础上的高精度声学模型和语言模型训练,并结合***的解码引擎工程技术,使识别效果和识别速度有了质的提升。大词汇连续语音识别率达到95%以上,命令词识别率达到99%以上,解码引擎可以在用户讲话后40毫秒内给出结果,实现真正的“秒懂”。

不仅要“秒懂”还要24小时待命,在我需要的时候,发出特定的唤醒词触发语音识别系统,以实现后续的语音交互。然而这仅仅是挑战的开始,人类的语言是复杂的,每个人说话时,口音、语速、口头禅都不一样,智能设备只会识别一些基本词句显然远远不够,它们必须更懂你。懂你的口音、方言、口头禅亦或时不时蹦出来的专业词汇等。这就牵扯到另外一项技术——个性化识别技术。

个性化识别指的是语音识别系统具备自动学习并适应用户使用习惯的能力,你用的越多,它越懂你。一般来说,个性化识别包括发音和语言两方面。其中发音个性化主要是指系统对用户语速、口音等发音习惯的学习,而语言个性化主要是指系统可以对用户的特定词汇(例如人名、地名、口头禅、专业词汇等)具备更好的辨识性。在DingDong智能音箱所采用的个性化识别技术上,能够针对每个人的兴趣点、知识背景来进行个性化语言模型建模,从而准确识别出个性化的词汇内容。

联接之声:微联与京东智能云

既然是一款具有入口级战略意义的智能产品,在迈入了语音交互的这道门槛之后,它所要做的就是联接。DingDong智能音箱已经接入到了京东微联的平台当中,这意味着通过微联的平台你可以跨品牌、跨平台的与多种智能设备连接,并控制。目前京东微联对接的产品已经超过400款,覆盖生活电器、厨房电器、空调、可穿戴设备。试想一下,你可以对DingDong智能音箱发出指令,让其打开空调,关闭电源等操作。这种场景化的组合,正是微联赋予智能产品新的意义所在。

 

音箱与微联的结合,让我们看到了更接近电影中智能管家的形象。实现智能设备的统一管理,互联互通,大数据的集中管理,这样的做法,很好的规避了智能硬件之间形成的孤岛,数据无法互通的问题,真正的让数据包裹住用户,从而形成连贯的数据记录。

为了能够构建完整的智能生态,在微联的背后还有京东智能云的支撑,它将用户、智能硬件和APP应用三者有效的连接起来。使得智能硬件厂商和用户充分享受到大数据分析、云计算构建的智能硬件生态圈。实现智能场景化、开放服务、可对接O2O服务商等***延伸。

合作之声:京东与科大讯飞

DingDong智能音箱很好的体现了核心技术与智能产业链整合的威力。来自科大讯飞的语音识别和交互技术带来了流畅的交互,而京东微联则提供了跨品牌、跨平台的智能产品连接和控制,对于用户来说,DingDong智能音箱将扮演起智能家居交互中枢的角色。推动智能家居的普及,改变用户习惯。

智能音箱的智能家居语音交互入口定位充分显示了京东开放的智能生态布局,京东希望通过自己的努力推动智能行业发展,拓宽市场,赢得更多用户对智能产品的接受,从而带动合作伙伴共同成长。

关于京东(JD.com)

京东(JD.com)是中国***的自营式电商企业。京东为消费者提供愉悦的在线购物体验。通过内容丰富、人性化的网站(www.jd.com)和移动客户端,京东以富有竞争力的价格,提供具有丰富品类及卓越品质的商品和服务,并且以快速可靠的方式送达消费者。京东相信其拥有全国电商行业中***的仓储设施。截至2015年3月31日,京东在全国范围内拥有7大物流中心,在43座城市运营了143个大型仓库,拥有3,539个配送站和自提点,覆盖全国范围内的1,961个区县,且全部自营。

关于京东智能(JD Smart)

京东智能成立于2014年8月,承载着京东集团未来在智能领域的创新与布局。它通过JD+计划整合了智能产业链上下游优质资源和微联技术平台,为用户提供有品质的智能的互联、互通产品,让他们生活的简单、快乐。京东智能建立了开放的线上页面,聚集了用户和品牌商、初创团队,让用户来京东一起玩智能、感受智能生活。

关于科大讯飞(iFLYTEK)

科大讯飞股份有限公司(iFLYTEK)是一家专业从事智能语音及语言技术、人工智能技术研究,软件及芯片产品开发,语音信息服务的***骨干软件企业。科大讯飞的语音合成、语音识别、口语评测、自然语言处理、麦克风阵列等智能语音与人工智能核心技术,代表了世界的***水平。

2014年8月,科大讯飞发布了“讯飞超脑”计划,核心是让机器从“能听会说”到“能理解会预测”。基于在人工智能研究的突破,2014年科大讯飞***参加国际口语机器翻译比赛就击败了国外***研究机构和院校,摘得桂冠。作为“讯飞超脑”的重要组成部分,科大讯飞正牵头国家“863”重大专项——类人答题机器人项目的研发工作。科大讯飞为全行业2000多家企业提供语音核心技术,占有中文语音主流市场70%以上市场份额,在教育、通信、金融、互联网等领域广泛应用。2010年,科大讯飞在全球发布了***提供移动互联网智能语音交互能力的“讯飞语音云”平台(该平台应用项目合作伙伴超过6万家,终端用户数量超过6.8亿),并且在最近将更具人工智能属性的云端自然语言处理和全球识别率***的人脸识别技术纳入其中。目前,科大讯飞已发展成为亚太地区***的语音上市公司和智能语音与人工智能产业的***。

责任编辑:Ophira
相关推荐

2015-08-05 17:26:08

DingDong

2015-11-18 10:44:12

智能

2015-07-17 18:45:59

拆机

2015-02-11 17:45:51

移动互联网

2021-03-12 15:17:20

智能音箱心脏监测物联网

2011-09-06 17:31:49

Windows7

2017-08-17 12:14:59

谷歌智能音箱

2020-01-16 13:53:24

物联网互联网

2018-03-27 12:45:27

百度AI小度在家小鱼在家

2018-08-09 12:04:00

智能音箱

2016-01-08 19:10:00

京东智能

2018-07-13 06:45:55

2017-07-05 16:41:23

阿里巴巴人工智能天猫精灵X1

2018-06-11 17:12:54

小度智能音箱儿童模式极客模式

2012-08-27 16:53:49

麦克赛尔

2015-07-30 23:16:35

高档

2018-04-24 10:14:27

Facebook智能音箱延售

2019-04-17 17:59:49

百度小度智能音箱

2017-09-21 14:10:36

智能设备
点赞
收藏

51CTO技术栈公众号