【51CTO 12月29日外电头条】编者按:Tim O’Reilly是O’Reilly媒体公司的创办人,也是自由软件和开源运动的倡导者。在2010年即将结束之际,他谈论了数据挖掘方法、预测分析方法,以及为什么移动传感器是他认为的未来计算的核心。以下是全文编译:
现在许多公司是否认识到数据的重要性?
Tim O'Reilly:长期以来,数据可以说是大白于天下的秘密,只是大家没注意罢了。我很早以前就明白,数据是互联网时代获得竞争优势的关键。我早在2005年撰写的一篇Web 2.0文章中阐明了这个观点。很显然,现在大家都明白了这点。像商务社交网站LinkedIn和网址缩短服务商Bit.ly这些公司如今还设有“首席数据科学家”这一职位。数据和算法是众多公司开展业务所依赖的基础,而这一点只会越来越明显。
每天的数据越来越多,我们会看到创新的应用以新的方式使用数据。就拿Square公司来说。这家支付公司希望通过分析社交网络,从一定程度上来减小风险。这一招果真管用吗?谁也不知道。连谷歌都无力克服算法本身的限制。
最近《纽约时报》刊登了一篇文章,称有个人想出这么个点子:获得大量的负面评论也能换来很高的网页排名。这就引来了新的问题。谷歌不喜欢进行人工干预,所以他们会对自己说:“我们怎么通过算法来解决这个问题?”(注:谷歌的对策是采用了算法解决方案。)
我并不了解谷歌的搜索质量小组内部出现的情况;但我认为,可能有一些新的数据源,谷歌可挖掘它们来改善业绩。我一直在建议谷歌与那些有数据源但不善于获取数据的人进行合作。
由此看来,我认为将来数据方面的合作会更多。几家公司采取合作,可以完成单干无法完成的事情。我想到了一点:谷歌时代是人们并不认识到数据有多宝贵的时代。许多数据就在那里,谁都可以获取。此情此景不复存在。有些数据源现在得到了牢牢保护。
举例来说,Facebook就不会随便由谷歌这样的公司获取其数据来改善谷歌自己的业绩。Facebook对于这些数据有自己的用途。与此同时,以前谷歌允许Facebook用户提取Gmail联系人资料,然后添加到Facebook好友列表,现在给予的回应是设定了自己的限制(51CTO编辑注:Facebook一直不允许用户导出自己的联系人数据到谷歌,这使得谷歌在前两个月对想要进入Facebook的谷歌用户发出“您的关系网可能被Facebook锁入”的警告)。这就是为什么我认为将来会出现更多的数据共享协议以及更多的数据许可。
谷歌与Facebook的联系人信息之争是表明新的数据挖掘方法的一个早期例子。我不知道为什么谷歌没有更早一点表态说:如果你获取我们的数据添加到你的网络中,为什么我们不能反过来也这么做?”这确实是个值得深思的问题。如果Facebook想确保自身数据的私密性,那是一回事。但如果它从“数据共同体”得到了好处,却什么回报都不提供,那是另一回事。
我还预计会出现重大的开放数据运动。这些运动与之前出于政治或宗教动机的开放数据运动将不一样。谷歌/Facebook之间的冲突这个例子就表明了开放数据之争的动机不是出于宗教或信条,而是出于功利。
源源不断的数据会如何改变商业分析领域?
Tim O'Reilly:先后创办了Palm Computing和Handspring这两家公司的Jeff Hawkins说,人的大脑就是一部预测引擎。如果你没有料到要迈的下一步,走路时就会绊一跤,那是由于你的大脑进行了预测,你的双腿按这个预测迈步子。
网上服务正以类似的方式变得智能化。比如说,谷歌最初在广告方面的竞争优势来自于它能够预测哪些广告最有可能被点击。人们其实并不明白这种预测的重要性。谷歌拥有一个更出色的预测引擎,这意味着它更智能化。从某种意义上来说,拥有更出色的预测引擎实际上决定了更智能。你比别人更了解真实情况。
以前的预测引擎基于商业智能,人们通过研究分析结果和报告来获取商业智能。新的预测引擎出于本能反应:它是自动化的。当谷歌在进行实时拍卖,搞清楚哪个广告会出现、哪个广告会给自己带来最大的经济收益时,新引擎就在起作用。当华尔街人士开发实时买卖报价算法,以确认该把股票卖给谁时,引擎就在发挥作用。这些例子都基于预测分析方法,而这种分析方法由机器来自动管理,而不是由研究报告的人来管理。
预测分析是今后几年值得思索的一个领域:应该考虑它是如何工作的,怎样成为这方面的行家里手,它如何改变众多行当,以及它与现有经营模式可能会发生怎样的冲突。
医疗保健业就是可能会带来冲突的一个例子。我觉得,预测分析方法在医疗保健业无疑大有机会,而且有希望在个体化医学领域大有作为。某些疗法比另一些疗法更有效,而且结论是有数据证明的,但现有体制不是根据疗法效果来补偿费用的。设想一下:医疗保险体制的工作方式如同谷歌,那将会是怎样。那样的体制会说“你想开什么药,可以开什么药,但我们会按照哪种药药价最低的标准来补偿费用。”那样一来,医生很快会开药价最便宜的药物。我们现在的做法恰好与之相反:医生开医药公司要求他们多开的药物。最后,医生建议采用从数据上来看效果不见得更好、但费用高出三倍的特殊药物。制药公司的经营模式都取决于这个畸形的市场行为。如果我们改用预测分析方法,那么实际上有望大幅削减成本,并且让整个体制运作更顺畅。但是你如何才能实现这个目标呢?
预测分析方法会逐渐进入到新的领域,并创造机会。一个典例是在政府2.0峰会上登台亮相的一家公司PASSUR Aerospace,该公司一直在为航班准点进港管理预测分析工作。差不多10年来,它一直在跟踪分析美国的每一架商业班机,并将分析结果与气候及其他因素方面的数据关联起来。这家公司在预测航班何时实际进港方面,比各大航空公司或美国联邦航空局还要准确。因而许多航空公司聘请该公司帮助管理预测航班何时进港。
移动传感器出现在了你最近的多次谈话中。为什么传感器那么重要?
Tim O'Reilly:最近我与O’Reilly AlphaTech Ventures公司(OATV)的联合创办人Bryce Roberts谈论了传感器如何把OATV的一大批投资项目联系起来。英国Path Intelligence公司使用手机签到功能来统计购物大厦及其他场地的人流量。基于位置的社交网站Foursquare使用传感器告诉别人你在哪里。RunKeeper软件可以在你跑步时跟踪你,这是另一种基于传感器的应用。
智能手机是一种移动传感器平台,这个想法绝对是我认为的计算未来的核心。我认为,它也应该是每个人憧憬的计算未来的核心,因为我们学会使用手机及其他设备中传感器的方式将是出现重大突破的几个领域之一。
【编辑推荐】