语音识别不是革命性的。多年前, IBM 的语音识别软件在 PC 上就有不错的识别率了。
基于语音识别,简单的智能分析和系统功能的调用也不算革命性的。无论是 Google 的 Voice Action ,还是 Vlingo 等独立的公司,做的都不错。
但是,从目前流出的视频看, Siri 并非这些已知技术的简单组合。
Siri 的智能程度更高
Vlingo 中你说 “Text Mike ,Messages How are you.” 。利用关键字的匹配就可以完成很多事情了。 Text 是命令, Messages 是关键字。匹配上这两个词,就知道给谁,发送什么内容了。
而 Siri 理解上下文。你问了北京的天气,再说:“ How about Shanghai ?” ,他知道你指的是天气。
一个更惊人的例子出现在 Siri 被苹果并购前的演示里。你说“ I like a romantic place for Italian food near my office”。
Siri 回答:” I am looking for a Italian restaurants which reviews say are romantic near your wok in San Jose…“
这个回答说明 Siri 听懂了 romantic 是个形容词。并且知道 near my office 是个地方。并且,找到了以前存储的用户的工作地点。并且,他知道怎么判断一个餐馆是否 romantic !(去搜索 reviews )
把同样的话对着 Android 的 Voice Action 或者 Vlingo 说一遍,你就知道 Siri 具有超越现有 Apps 的智能。
Siri 和系统的整合更加紧密
Siri 在并购前的版本整合了大量网络服务的 APIs 。比如 OpenTable,Tickets.com,Taxi Magic 等等。
而 Siri 被苹果收购了之后, 他已经被整合为系统的一部分了。
在 iOS5 的 Siri 视频中,出现新短消息之后,交互由 Siri 发起。说明他已经常驻系统后台并且可以接管重要的系统功能了。(除了短消息还有天气,时钟,Maps 等等)
#p#
Siri 的团队?
判断 Siri 靠不靠谱的另一个角度是看看到底是谁在做?
2003 年美国国防部高级研究机构(DARPA)发起了一个相关的项目( “enduring personalized cognitive assistant.”)。而 SRI(斯坦福研究院) 负责这个项目的研究,项目被命名为 CALO 。这就是 Siri 的前身。
DARPA? 互联网的前身和 GPS 都源于 DARPA 的项目。
SRI 参与的创新?鼠标,互联网,无线通讯,超声波,机器人 AI ,语音识别等赫然在列。
Siri 被乔布斯看中?
2009 年 2 月, Siri 登陆 AppStore 。
2009 年 3 月,苹果收购 Siri 。价格不详。
2011 年 10 月,苹果发布和系统高度整合的 Siri 。( DARPA 项目的 8 年之后)
(时间表来自 Mashable )
苹果收购 Siri 的决定之快,价格之高,和 iOS5 的整合之紧密,让人怀疑这是个高层决策。(收购价格不详,假设第二轮出让 10% 股份,在此之后 Siri 的估值不会低于 1.5 亿美金。苹果的并购很少超过这个数。)
这次并购展示了苹果对于新科技的超凡的预见能力。他总能发现那些真正会改变生活的技术。(比如电容多点触摸)
再一次,让人想起乔布斯。对他来说, Siri 可能不过是当年在帕罗奥多那里看到 Alto 情景的重演而已。(而最近几天的报道证实,乔布斯在病重期间一直参与苹果的决策。)
Siri 威胁了谁?
拥有 Siri 的 iPhone 4S 会威胁 Android , WP7 等其他智能手机。但是,这并不是最重要的。
Siri 如果真的如苹果的广告那么好用,他会威胁到 Google 的命根子:搜索。
搜索不再是“搜索框,网站,功能,结果”的流程了。这个流程太慢,太复杂。
搜索变为 “ Siri 语音识别,智能分析,调用本地 Apps 或者网络 APIs ,整合所有结果为最合适的内容表现给用户”。
Siri 变为“入口”。所有的 Apps 和网络服务都在他的后面。
据说为了让 iPhone 使用 Google Maps , Google 每年付给苹果 10 亿美金。相信没人会怀疑, Siri 最终会装在上亿台 iOS 设备上。
那时,有多少网络服务商,要为他的各种服务付出多少?