今年1月,工业和信息化部印发了《大数据产业发展规划(2016-2020 年)》,提出全面部署“十三五”时期大数据产业发展工作,加快建设数据强国,为实现制造强国和网络强国提供强大的产业支撑。预计,中国大数据产业市场在未来五年将保持高速增长,到2020 年中国大数据产业规模将接近5万亿元。
大数据已在各行各业得到了普遍重视,有CIO更表示,如果跟同行交流,不讲大数据都不好意思跟人家打招呼,然而在业务中却发现,上了大数据的“数据驾驶舱”,除了老板看到了更酷炫的报表外,对业务并没有太大的帮助。这种感受无独有偶,在刚刚(12月7日)举办的2017中国大数据技术大会上,中科院院士徐宗本就表示,“实施大数据是一件很不简单的事,如果有哪个企业号称有一种软件包供你使用就能分析大数据、就可以解决问题,这一定是忽悠你、骗人的。”
如何避免大数据系统只是一个酷炫的看板,澳洲昆士兰大学教授周晓方表示:“首先要定位问题,企业需要解决什么问题,然后再去找数据帮我们去解决这个问题。其次,有了数据以后我们要解放思想,创造新的应用与价值。这个需要企业界和科研界合作解决这个问题。大数据是我们这个时代的特征,这个事情已经在那,数据本身也在那里,数据应用的技术也在那里,要通过各种应用场景现才能真正落地。因此CIO们不能为了大数据而大数据,而是要锁定你要做的事情、你有数据,还需要什么数据,用这些数据把现有的工作做得更好,用这些数据推动新的应用。”
微软亚洲研究院副院长、***研究员刘铁岩(左一);
华东师范大学数据科学与工程学院教授、博士生导师钱卫宁(中);
滴滴出行高级副总裁章文嵩(右一);
滴滴出行高级副总裁章文嵩在运用大数据解决出行问题上深有体会:“首先要定位问题是什么,如何定义这些问题,把问题梳理清楚后基于这些问题看在数据上能不能得到一些启示。滴滴是一个出行平台,现在解决的问题是让有需求的人迅速找到最近的车,因此每秒钟这个车的位置数据都会记录在我们的平台上,这些连续的数据就是行车的轨迹,这个轨迹很好地呈现了在全国400多座城市的交通的状况。我们发现这些数据在智慧交通的治理方面将是非常有价值的数据,因此我们要拥有一些数据后才能发现数据的价值。”
“数据只是我们拥有的一部分,我们拿到的数据是一个基础,一定要从过程中找到价值。过程是我们做机器学习的这个过程。”微软亚洲研究院副院长、***研究员刘铁岩认为应该从人工智能这个维度运用好大数据。他表示,“大数据一定要把数据和智能结合起来,要有全盘的规划。在这个角度来讲。要什么数据是为了实现种业务目标找合适的数据,而不是要拿到所有的数据留下来就好、数据大也有很多好的方面,很丰富,但也有坏的方面,有些是噪声,有些可能是错误,如果没有一个有效的方法把噪声去除掉,把有价值的信息挖掘出来,***也会把我们引导到一条错误的路上。”
对于数据质的量章文嵩非常重视:“数据质量非常关键,如果数据不准,得出的任何结论就会有问题,而解决的办法涉及到数据的收集、生产、传输整个过程。我们对数据肯定是要层层校验,哪些校验有些环节数据不准了,或者有些环节数据丢了,就拿滴滴派单来说,用户进来表达了他的目的地之后我们会有很多的动作,然后是我们平台是否派单,派单在执行中到完单***到支付,这是个漏斗模型。其实层层环节都要校验,发现哪些环节是网络传输处理的BUG,哪些环节导致了数据丢失,层层校验就跟财务做校验一样,每个环节都要校验,确保数据准确性和软件的正确性。
华东师范大学数据科学与工程学院教授、博士生导师钱卫宁则认为:“数据已像我们的电一样,人类文明在有电之前与有电之后很不一样,如果有了电我还在用蒸汽机会觉得电没有多大作用。现在有了数据之后,我们的业务模型或决策模型都是要变化,如果有了数据后还只是用作展示报表,这个还是传统的思维模式。有了数据之后如何根据数据重构商业模式,去重新设计整个业务流程,才可以把数据用的更好。”