本文转载自公众号“读芯术”(ID:AI_Discovery)。
近几年来,另类数据一直是投资者关注的热门话题。对冲基金通过利用非传统数据集获得洞察力,并从中获取巨额利润。而对于普通投资者或任何使用传统标记者来说,这种洞察力难以获得。
摩根大通称,对冲基金投资者十分重视另类数据,2017年资产管理公司在另类数据上的投资已经达到20-30亿美元,且此后每年都增长10-20%。
但从另类数据中获利的不仅仅是对冲基金。各类企业都可以利用另类数据来提高收益——最具创新性的公司已经意识到,另类数据是实现其竞争优势最大化的关键。事实上,利用另类数据的科学分析要优于基准测试,其性能比传统分析方法高出约13%。
另类数据到底是什么?
简单来说,另类数据可以是用于分析的任何数据,但其分析通常不会用于做出决策。另类数据包括代理指标,这些指标用来替代一些难以判断的因素,还包括来自非官方渠道的信息,个人可以使用这些信息深入分析。另类数据既提供了新型商业智能,也提供了新型理解方法——如何理解来自传统数据中的商业智能。
正如标准普尔全球公司(S&P Global)首席信息官克里希纳·内森所说:“另类数据来自非传统数据源,因此对数据进行分析时,它们会产生额外的洞察力以补充传统数据源获得的信息。”
另类数据来源会因不同的行业和分析类型而有很大的差异。投资者们已在使用信用卡交易、手机定位数据以及网页搜索等各种办法获取信息,甚至追踪公司的私人飞机也被用来评估是否要投资某家公司。
图源:unsplash
在投资领域之外,另类数据也可以有效地发挥作用。零售商利用从卫星图像中获取的数据来决定在何处开设新门店,金融科技公司使用现金流标记和教育背景来评估无信用记录人员的信用度,就连旅游公司也使用从互联网上收集的另类数据来决定所提供便利设施的位置和种类。
我工作的Evo是一家供应链和定价AI公司,因为使用另类数据,我们的供应链工具将库存效率提高了至少10%。我们使用各种网络数据来试验以改进分析,在使用另类数据方面大获成功。
我最喜欢的案例之一,就是采用门店经理对销售趋势的看法,我们允许门店经理指定他们认为在接下来的销售期间最有可能流行的特定商品。这种方法让管理者来充当代理人,更本地化、更精细化地判断销售趋势和商品受欢迎程度。这种方法奏效了,我们预测的准确性提高了5个百分点,比最初的补给系统提高了20个百分点。
另类数据如何推动数字转型?
对于那些希望在当今经济中占有一席之地的企业而言,数据驱动型决策至关重要。这就是大多数公司使用大数据分析来收集商业情报的原因所在。然而,这些公司中却很少有人真正了解有效利用数据来实现公司内部数字转型的办法。
为什么会这样呢?因为他们仍在分析相同的数据。真正的数字转换不仅仅是将人工智能和机器学习整合到当前的决策过程中,而是利用新技术来重新思考解决问题。使用新工具分析传统数据时,确实可以更高效地收集商业情报,但是总体上收益是有限的,除非真正应用另类数据。
在分析中应用另类数据有助于思考传统方法无法提供的新策略。你可以完善分析内容,以获得更细致、更实时、更准确的建议。只有这样才能实现预期内由数字转型带来的显著进步。
麻省理工斯隆学院数字经济倡议的研究科学家乔治·韦斯特曼说:“真正完成数字转型后,就像毛毛虫破茧成蝶一样,但如果做错了,你所拥有的只是一只速度极快的毛毛虫。”
寻找真正的另类数据
图源:unsplash
作为一名数据科学家,仅仅知道另类数据有助于改进分析是无济于事的,你必须了解哪些数据能够帮助你实现商业目标,提供有用的商业智能。虽有如此多的数据可用,但大部分数据只是垃圾,最终毫无用处。
统计学家、FiveThirtyEight(新闻网站)的创始人和总编辑内特·西尔弗说:“每天,每秒三次,我们产生的数据量相当于美国国会图书馆全部纸质馆藏中的数据量。但大部分数据就像YouTube上的猫咪视频,或是13岁孩子们互相发送关于下一部《暮光之城》的短信。”
过滤掉一些正确的另类数据只是试错。选择一个可用于分析的数据源,评估选择该数据的风险,并做出最佳猜测。这些结果可以让你在做了一些测试之后,找到最佳选择。
不过,最终你会提出正确的问题从而选择正确的数据。当你优先考虑真正的业务目标而不仅仅是关键绩效指标时,就可以更容易地找到所需数据来完善不足。我倾向于使用常识性的方法,不过这完全取决于环境。当我和客户工作时,我一定会先找到他们的动机。为什么他们希望提高供应链的效率?答案将有助于我找到另类数据的合理来源。
图源:unsplash
大数据正在颠覆数据科学家们所面临的挑战。我们不再费力寻找大量的数据来源,而是努力在海量可用数据中找到连贯有用的模式,分析海量另类数据只会复杂问题。但我们必须迎接挑战。当今最好的商业智能来自非传统数据源,数据科学家们有责任精确定位并分析数据。
另类数据是数字转型的未来,不能在分析中应用它的公司将面临淘汰。如果想最大化投资回报率,首先要投资正确的信息,这就是另类数据。