对于这一消息,最高兴的应该是百度,我想百度应该一直在等待这个时间节点。2013年底李彦宏充当大数据义务宣传员向国家高层介绍汇报大数据;2014年两会,李彦宏在政协记者会上表示,政府应该把更多和人民生活有关的数据资料,公开的放到网络上;2015年两会,李彦宏的“中国大脑”提案之中同样包括建议政府聚焦大数据这部分。在推动政府大数据开放上,百度如此积极在于,百度有能力,也有动机利用好政府大数据。政府大数据,对于百度而言是求之不得的宝贵外部资源。
百度需要政府大数据做好搜索本身
搜索为核心业务的百度,本质上是一家搜索公司,搜索做的事情,实际上是对数据的处理和信息的连接。理论上来说,百度、Google们是最具“大数据基因”的公司。搜索引擎在移动互联网时代正在经历一个前所未有的转型:即搜索的内容从WEB数据,升级到所有数据;搜索引擎的功能定位则从信息与人的连接者,转型为服务与人的连接者。
移动互联网上,App所造成的信息孤岛效应、企业服务背后的海量结构化数据、政府正在开放的高价值民生数据,对于搜索引擎而言都具有巨大价值。以政府为例,交通、健康、卫生、环保、气象,诸多数据其实承载的是政府的服务。百度要帮助用户连接各种服务,自然不会少了政务服务。如何将政府开放的数据以及背后的服务集成到百度搜索,是百度面临的新的挑战。
在过去的几年里,百度已经意识到这一趋势并尝试接入政府大数据。主要是通过点对点项目的方式,先后与国家知识产权局专利中心、药监局、北京市卫生部门达成合作,接入其数据整合到百度搜索之中。百度还上线了政府网站搜索,整合了庞大政府信息网页库,帮助用户搜索各类政府公文、政策法规等政府信息。另外在《穹顶之下》让全民关注环保问题之时,百度还推出了“污染地图”整合了环部门相关数据。总之,要做好搜索,满足网民诉求,整合政府大数据,以及背后的服务,是必须要做的事情。
政府大数据给百度带来新的业务空间
百度未来的业务版图里面,大数据一方面为搜索服务,一方面又将诞生出新的业务板块。
2014年一个重点业务便是百度预测。搜索解决的是从海量数据和服务中找到所求的问题;而预测则是基于大数据分析的未来趋势变化,可被应用在气象、人流、物流、经济、房价诸多预测上,服务于生活和生产。统计局曾公布其基于百度搜索数据预测不同城市的房价变化,效果良好。旅游预测可以帮助旅游管理部门和景区做好预案规划,交通预测有助于交通规划部门和铁路民航公路做好客流物流疏导,流感预测可以提供给卫生部门做好疫情防控,大数据预测有着巨大的应用前景。
基于大数据的应用,预测只是其中一种。基于大数据挖掘的精准个体追踪可被应用在精准营销上,对于政府管理有参考价值;基于大数据的规律发现和统计学应用,则可以帮助政府以及相关机构做好社会调研,比如成为统计局的数据源;基于大数据的百度指数、百度统计等已普及应用,可适用在政府舆情监控等领域。美国政府大数据平台DATA.GOV上除了政府开放的数据之外,还有第三方开发的各种大数据应用,中国政府大数据开放后的应用,百度同样可以开发,甚至整合到百度平台——过去几个案例正是这样做的。
总之,百度需要大数据做好搜索,同时可以基于政府大数据研发更多潜在应用,这些应用要么可产生商业价值,要么将具有社会公益价值,都将给百度带来新的业务空间。
百度凭什么享受政府大数据红利?
我曾分析过,中国政府开放大数据,在标准化的统一数据开放平台建立起来,必然也只能选择大公司优先的方式。这里的大公司,其实备选名单并不多。中国在大数据技术上最有作为的公司,有两家:一家是百度,另一家是阿里。
百度在技术上有过人之处,正如前文所提及,百度一直做的事情就是处理数据,最具“大数据基因”,百度在大数据上投入力度也相对较大,成立了大数据实验室、深度学习实验室和人工智能实验室,广纳海内外顶尖人才。百度大数据引擎是首个开放的大数据处理平台,百度大脑为大数据挖掘和预测等业务提供基础支持,深度学习是大数据产业的关键基础型技术,多媒体识别、自然语言处理则是大数据的上层实践应用。大数据这个概念是比较新,但对数据的挖掘和相关的技术积累,百度基础扎实;而基于深度学习的大数据技术则让百度走得稍稍快了一些。
百度是信息和服务的入口,它连接人与信息、人与服务。它具备媒体属性,因为是信息入口;它是服务平台,通过阿拉丁计划百度搜索结果页已经丰富多样,承载了不同的服务包括政务服务。手机百度的服务风格更是愈加明显。政务服务上网,在线政务信息和在线政务服务需要通过百度输出,百度在这个过程中就拿到了部分政府大数据。
还有一点是百度本身便拥有政府部门所需的民间大数据,可以与政府部门形成双赢合作。百度拥有最全最庞大的WEB数据,来自于网络爬虫时时刻刻的爬取解析索引;用户搜索则是表征着网民此时此刻想什么想要什么;移动App则收集着海量用户的位移、声音等数据;在物联网上的布局还可以拿到视频数据比如景点直播。这些数据实时传递并存储到云端,对于政府部门开展工作具有一定价值。百度为政府部门提供所需的大数据,还可以基于自己的数据与政府开放的数据交叉分析,让数据产生更大价值。
因此,政府开放大数据,最开心的应该是百度。百度要做好搜索,要落地自己的大数据战略,最需要政府的大数据。在技术上的积累,在网民大数据上的积累,以及互联网入口的地位,让百度有机会利用好政府大数据,享受这一个开放红利。