现如今,语音识别已经是微软的核心产品之一了,微软在Cortana身上投入了那么多就能看得出来,语音识别技术的一大挑战就是要让系统识别出用户究竟说了些啥。这实际上一直都是个挑战,尤其是在全球这么多语言和方言的情况下。而微软在这个市场上实际已经奋战了超过20年。
微软语音工程师与***科学家黄学东在接受采访时表示,微软在这部分市场的投入是20年前Windows 95时就开始的,不过当时语音识别的错误率接近100%。也就是说,那个时候的系统几乎听不懂你所讲的每个词,所以说当时用语音来控制电脑还是几乎不可能的。
但随后,这项技术就在大幅发展中,语音识别技术随后准确度提升了20%,据黄学东所说,这意味着不久之后,0%的错误率是完全可以做到的。
他预测:“未来4-5年内,计算机就能达到和人类一样了。”而实际上,这方面***的挑战并不是计算机能不能理解人所说的每个词,而是理解人所说的内容,这也是微软目前专注于Cortana的核心问题。
也就是说,5年以后,我们要跟手机对话还是可以达成的,但可能情况仍然不会特别好。黄学东说,微软已经明确这个是努力方向,而Cortana在Project Oxford和Microsoft Azure的帮助下,未来几年内就会成为语音识别系统的先锋。