智能语音已经进入爆发期。4月13日,百度AI全面赋能罗技合作启动仪式暨罗技VOICE M380语音鼠标上市发布会在京举行。会上,百度正式发布“语音输入服务”并宣布百度大脑和罗技达成合作,将领先的AI技术全面赋能罗技外设硬件,以“智能鼠标”为起点,助力智能时代人机交互体验的加速升级。
伴随着科技发展与市场需求,技术服务于载体的能力不断增强。百度集团副总裁吴甜指出:“百度和罗技都在以自己的产品体系为消费者持续打造全面、丰富、具有创造力的产品。百度一直在用人工智能技术提升产品体验,经过多年在人工智能技术相关的研发和应用实践,这些技术积累沉淀到了百度大脑。而百度大脑当中两个经典的AI技术就是语音技术和机器翻译。语音技术可让用户免去打字输入的麻烦,以更自然的交互方式搜索信息,找到所求;而机器翻译则在全球化进程发展的今天,为跨语种的交流带来巨大便利。”
(百度集团副总裁吴甜)
而在启动仪式上,罗技全球副总裁、罗技大中华区总裁蒋志兴表示,罗技经过40年的发展,已经成为全球云周边设备的领导厂商。而百度是全球领先的人工智能平台型企业,也是国家AI新基建的重要推动者和贡献者。我们对新场景新需求的探索永无止境,今天的发布会只是我们合作的开始。未来我们将会推出更多的产品,更多的应用,更多的体验,服务于更多的消费者和企业用户。
百度AI全面赋能罗技合作启动仪式中,凝聚双方智慧的罗技VOICE M380语音鼠标首次亮相。罗技全球副总裁、罗技全球C&P品类总经理Delphine Donne-Crock也发来致辞视频。她表示,我们期待将流畅自然的沟通能力与体验全部赋能在PC端用户的体验中,带去突破智能化办公场景的全新体验。
(百度AI全面赋能罗技合作启动仪式)
此外,活动现场百度总监蔡玉婷宣布“百度语音输入”服务正式发布,并全面赋能在罗技VOICE M380语音鼠标中,实现自由说、实时译的功能。基于百度大脑语音识别和机器翻译,用户在办公场景下可实现所说即所得。百度大脑语音识别赋能下的语音鼠标可支持中文、英文、日文3种语言语音输入,中英混合输入,以及粤语、四川话、东北话、河南话、山东话、西安话、合肥话等7种方言语音输入,尤其在长篇内容输入时方便用户获得轻松畅快的输入体验。此外,新品语音鼠标中还添加百度大脑语音翻译功能,可自由实现中译英、中译日、中译韩、中译法、中译西、中译泰、英译中、日译中8种语音翻译,服务人群更加广泛,帮助不同国界的用户跨越语言障碍,获得更加顺畅自如的沟通体验。
(罗技VOICE M380无线语音鼠标)
事实上,百度AI技术的进化和产业赋能始终保持着正向循环,相互促进。以百度大脑语音技术为例,2019年百度推出并上线使用的流式多级的截断注意力模型SMLTA应用到了百度输入法当中,大幅提升了自身语音识别的准确率;此外,在远场交互的场景下,百度推出的基于麦克风阵列的声音增强以及声学建模一体化端到端识别技术,也应用到了小度音箱等场景下,优化了整体交互时的准确率。截至目前,百度语音技术服务日调用量已超155亿次;在移动端的设备上,百度搜索、输入法、百度地图等产品,以及智能设备的场景上,比如智能家居、智能车载系统、语音IoT设备等中都有非常广泛的应用。同时,百度也推出了语音AI芯片百度鸿鹄,在功耗和性能方面也具有领先的技术优势。
同样,机器翻译也是百度很早就开始积累和打造的AI系统技术之一。2015年5月,百度发布全球首个互联网神经网络翻译系统;2019年在国际权威机器翻译评测WMT中,百度超越国内外知名企业,在中英翻译位列第一;而在多语言翻译方面,针对语言数量多、分布不均衡、实现难度大等难题,百度研发了基于神经网络的多语言翻译统一框架,世界范围内首次突破203种语言互译,翻译质量业内领先。从演变来看,百度一直在多种技术中占据着世界级领先优势,助力百度自身业务发展的同时,可以更好地赋能多场景、多产业应用。
当天,在“语音输入的变迁与未来”圆桌讨论环节中,罗技大中华区品类营销总监张亮、罗技C&P品类全球高级产品经理王小云、百度语音首席架构师贾磊、百度总监蔡玉婷等业内专家围绕智能语音技术未来发展趋势、破局,以及技术挑战等内容展开交流讨论。
(圆桌论坛现场)
AI 要在广泛的场景落地应用,并不断解决实际问题创造价值。百度大脑已对外开放270多项核心AI技术能力,广泛地落地生根于互联网、工业、农业、金融、城市、医疗、能源、教育等诸多行业。
不难感受到,百度作为拥有强大互联网基础的领先AI公司,基于百度大脑技术引擎,通过智能云以全面领先的技术优势为开发者和企业持续赋能,助力打造具备智能体验的特色应用与产品,加快AI在各行各业的应用落地进程。