3月20日,思必驰在2018中国人工智能应用与生态峰会上荣获中国领先语音智能厂商的殊荣后,中国软件网独家专访到了思必驰CMO龙梦竹,就智能语音的发展、思必驰的应对策略以及备受关注的DUI开放平台等内容展开了对话。
语音是IOT时代的人机交互方式,发展潜力巨大
火爆的人工智能市场中,机器视觉和智能语音一直是最受关注的发展方向之一。机器视觉的厂商无论从融资额还是市场估值普遍都高于智能语音厂商。最直接的原因就是机器视觉已经找到了相对成熟的商业落地模式,在安防、医疗等领域能更为明显而直接的带来效率的提升。
语音与视觉不同,语音是富信息,语音交互中带有音色、音量、速度、节奏等信息,不同的语境与语调会带来***的可能。人类经历着从PC互联时代、移动互联网时代到现在IoT时代的发展,交互方式也从传统的按键、触摸等交互方式向语音交互方向发展。产业链正在迎来变革,AI及AI+的专业分化进程加速。龙梦竹表示,语音交互成为IoT时代最重要的交互方式之一,将会迎来更广阔的发展前景。
由于语言本身的多样性,智能语音技术难度和壁垒较高
随着阿里天猫精灵、联想智能音箱、小米互联网音箱的火爆,在背后提供语音交互技术支持的思必驰也逐渐在公众面前露出。不知从何时起,“人工智障”这个词成为了大家戏谑和调侃的口头禅。谈到语音交互的现状,与大家将“人工智障”归结于技术问题的认知不同,龙梦竹认为目前语音智能的技术水平已经比较成熟,但也存在几个方面的问题与瓶颈有待突破,其中语音交互场景中不确定因素多、单点智能到整体智能路径的瓶颈、性价比和内容知识图谱建立不完善等问题,都对语音交互体验有所影响。
首先,语言本身包含的内容非常丰富。比如:“嘿,等着我”既可能是夕阳下少男少女口中的呢喃,也可能是打架斗殴后撂下的狠话。另一方面,大家对语音交互的测试挑战早已超出了正常对话状况,毕竟没有人在对话的时候突然冒出一句“**放个屁”“***,天王盖地虎”,但这种挑战人工智能的对话,对智能硬件来说早已习以为常了。其次,人们已经习惯了在场景下的不同反应,但对于人工智能而言,交互是一个全链路的过程,不仅仅是语音识别,还有语义理解、语音合成等一系列环节,单点智能到整体智能的路径依然没有打通。知识图谱作为人工智能的底层技术之一,其技术成熟度也在制约着人性化的交互方式的进展。
专注语音技术的场景化落地,以DUI开放平台构建AI生态
那么,专注于人性化智能语音交互技术的思必驰,在智能语音的瓶颈突破方面又将如何破局呢?
龙梦竹介绍到,思必驰专注于打造人性化的语音交互技术,对于立足于技术的思必驰来说,技术是根本,但并不是瓶颈,如何将技术应用到现实的场景中,用户体验和技术同等重要:一方面,思必驰与内容资源方合作积极扩展第三方内容资源,为用户提供更多的内容服务;另一方面,思必驰将继续在专注细分领域的同时着力构建开放平台,赋能更多智能硬件,助力传统企业转型。在生态方面,思必驰于2016年成立驰星创投,得到了元禾资本、富士康、清华控股等LP的支持,旗下拥有两支基金,分别为2亿元天使基金和10亿元成长基金,专注投资人工智能和智能交互产业早期项目。思必驰在AI领域全面布局,加速在物联网领域的深入和拓展,打造AI生态,赋能万物。
硬件厂商与语音交互技术公司的传统合作模式中双方的沟通成本较高,,在自定义产品功能、系统迭代、内容升级等方面往往会存在延迟,造成了开发周期长、更新迭代慢等问题。此外,智能语音交互技术的整个链条较长,涉及到前端信号处理、唤醒、识别、语义、对话、问答等诸多核心技术,对于开发者来说比较复杂,有一定的技术门槛。因此,向开发者开放语音交互技术、让用户自定义产品、大规模定制开发成为必然方向,思必驰DUI开放平台也应运而生。
出于好奇,笔者也注册了一个DUI平台账号,快速体验了一把平台上的“技能包”。只要在左侧输入内容,右侧同步输出代码。作为“代码盲”,从未感觉到原来技术可以离我们如此之近。当技术做到如此贴近开发者的时候,技术与行业场景、整体智能的融合还会远么?
与龙梦竹的交谈中,总是能深深的感觉到她对DUI平台的笃信与自豪,或许这种自信源于专注领域的成功和对技术的信仰吧。伴随着人工智能与物联网的融合, DUI+IOT的智能产业生态构建。思必驰还将带来哪些惊喜,我们拭目以待。