EMC咨询服务部CTO
“大数据已死。”
大数据过时了。”
“我们不再需要大数据,我们现在需要机器学习。”
… …
这是我在2017年时常听到的话语,大数据已死?我并不认同,在我看来,大数据是一种思维,是一种利用数据和分析技术,使你的业务模型变得更加有效(见图一)。
图1:利用大数据使业务发展变得更加有效
大数据是一种思维方式
大数据是关于组织利用数据和分析来推动业务模型的能力,优化关键业务和运营用例,减少安全和合规风险,发现新的收入机会,创造更有吸引力的差异化的方式。大数据的技术组件包括:
- 数据:能从各种数据源,包括结构化(表格,关系数据库)、半结构化(日志文件,XML,JSON)和非结构化数据源(文本,视频,音频,图像)收集和汇总详细数据。
- 分析:能利用高级分析(数据科学,深度学习,机器学习,人工智能)发现客户,产品,服务,运营和市场洞察力。
这些是重要的技术构件,但是它们本身并不提供业务或财务价值。这对于推动大数据,数据货币化来说是必要的,但还缺一角。
大数据是关于数据货币化
大数据就是利用数据和分析的独特性作为数字资产,为组织创造新的经济价值来源。大多数资产呈现出一对一的交易关系。例如,一美元作为一项资产,它的价值是有限的,人力资源也一样,一个人一次只能做一项工作。但是衡量数据作为一种资产的价值并不受这些制约。
事实上,数据是一种不寻常的资产,因为它具有叠乘效应,不会耗尽或磨损,并且可以在接近零边际成本的情况下同时用于多个用例。这使得数据成为投资的有力资产(见图二)。
大数据是一个商业学科
今天数字化转型的领先企业,已经将数据和分析视为商业准则,而不仅仅是另一项IT任务。因此,明天的企业领导者必须成为利用数据和分析来推动业务模式的专家。从市值角度来看目前最有价值的公司,是那些掌握使用大数据(通过人工智能,机器学习,深度学习)来驱动新的价值来源的组织。
图3:世界上最有价值的公司
数据科学是数据货币化的引擎
数据科学可以更好地预测商业和运营绩效的变量和指标,并量化因果关系以预测可能的行动和结果,提供纠正措施或建议,防止代价高昂的结果,同时随着环境的变化不断学习和适应。
为此,数据科学家需要学习各种各样的统计,数据挖掘,深度学习,机器学习和人工智能技术和工具。
图4:高级分析示例
数据货币化需要与拥有制定业务和分析战略责任的业务利益相关者进行密切合作。这些利益相关者还明确界定了要测试的假设,并清楚说明如何将分析结果付诸实施和货币化。争取企业领导力的关键是把他们变成“数据科学公民”,教他们“像数据科学家一样思考”。
大数据的状态
大数据与机器学习之间的关系:
当互联网创造了网站和搜索数据的宝库时,大数据就开始了。今天,社交媒体,移动设备,可穿戴设备,物联网,甚至是不断收集信息的麦克风和摄像机,已经增加了数据。
有了这么多的数据,机器学习提供了一种将数据组合起来,并使之有意义的方法,机器学习通过这些数据来辨别模式并预测新的模式。
机器学习在人工智能的发展中起着关键的作用。人工智能是指机器执行智能任务的能力,而机器学习是指机器清除数据中有意义模式的自动化过程。没有机器学习,人工智能是不可能的。
大数据是一种转变业务领导力,并使之变得更有效率的思维模式,通过利用数据和分析来强化企业业务模型。
图5:利用数据和分析创建智能企业