大数据无疑是时下炙手可热的流行词汇,然而,我们鲜少看到具体大数据如何带来收益,和具体如何实现的例子,这是怎么回事呢?
多年来,在经历了几个通信和投行的大数据相关早期实施项目后,我认为这个新兴技术的收益主要在于:实现对复杂系统更为精准的剖析,例如股票市场或供应链。(投行成为最早一批应用大数据分析的行业之一,可谓毫不意外。对利用技术提升效率,创造效益更为敏锐的商业模式,往往也是更赚钱的。)
在投行的日常工作中,为了精准地选择投资机会、选购股票,有大量对文档处理的需求,例如新闻简报,财务报表。如果人工进行,工作量过于庞大。因此助理分析师们往往简化他们的预测分析过程,并使用电子表格来完成绝大部分工作。通过大数据技术,投行可以整合各种信息,减少可能的(简化分析带来的)风险,从整体上带来更优越的分析和预测能力。
公司如何通过大数据赚钱
通过大数据平台,股票经纪和投资经理们可以聚合各种来源的非格式化数据,辅助判断哪些公司值得投资。所谓‘非格式化数据’包括如公司新闻,产品评论,供应商数据,价格变化,将这些信息以所谓“大数据”形式整合,通过建模,帮助股票经纪决策买入或售出股票。
有些采用如上方式进行投资预测的公司,很注重节约实施成本,例如使用云平台(如AWS),先从很小数量的服务器开始,随着获益增长,逐步提高投入。一位我认识的分析师,从一家大投行离职创业后,在不到六个月的时间内,仅仅使用非常有限的投入,创立了一个盈利良好的大数据交易系统。
即便在传统制造领域,大数据仍然可以提升预测能力。我曾经担任过顾问的某欧洲一线汽车制造厂商,通过建立一个钢材交易成本的分析系统,选择更好的时机,以更优价格买入原材料。这个系统由开源Java框架Hadoop创建,整合了多个供应商的共计15Tb的数据,在两年内为该公司节省了1600万美元。
这个项目的成功主要有两个原因:首先,公司有足够的信息为所有的供应商建模;其次,该项目节省的原材料成本超过了实施这个项目的费用。
公司为何因为大数据亏钱
然而,并非每个大数据项目都会这样成功。公司在大数据项目上以亏损告终的概率,有时和成功的概率相差无几。大数据项目失败的早期症状有很多种,最常见的问题如:
步子迈太大:大数据并不需要一笔巨大的预算,如果怀着巨大的投入将带来巨大回报的预期开始一个大数据项目,往往会产生问题。在正式开始前,明智的做法是,尝试用有限的投入,在小范围内测试这个技术是否确实能带来预期的收益。按这样的节奏,一个项目可以按部就班地随着收益逐步提高,而逐步扩大投入规模,确保收益始终大于投入。
低估人力投入:在开始实施一个大数据系统前,问自己一个简单的问题:这个项目是否可以不需要持续的人工支持来运作?如果答案是,需要人工支持,那么建议停止项目。建立这样一个项目往往意味着百万级的损失,无法在有利润情况下保持维护和运行。
迷信自然语言处理:大数据有个经常听到的功能是,通过自然语言处理,将各种领域的各种数据处理成直接可读可理解的形式。这听起来确实很赞,但是在实际应用中,往往不尽如人意。自然语言处理仍然存在许多妨碍应用的限制,主要由于人工智能的发展还不够--而且在可见的10年内,这个情况可能不会有很大改观。
现代大数据项目具备巨大的节约成本的潜力,其效果对于过去的数据处理方式而言有如童话。但需要谨记的是,在投入时间和资源到大数据项目之前,首先要确认你的项目是收益大于成本的。只有傻瓜才会匆匆对一个点子一见钟情并倾其所有。
作者Marco Visibelli是一位曾经工作于IBM,后离职创建Kuldat的数据科学家,他的公司主营运用大数据来为销售和市场分析潜在获益机会。