2017年,是大数据行业最为艰难的一年。
监管对数据乱象出手,从今年5月就开始了清理行动,几十家数据公司被调查,上万数据接口关停,一些公司开始裁员,行业风声鹤唳。
而另一方面,行业还承受了来自监管和业内人的质疑和否定。
大数据引以为豪的“数据驱动”风控模型,被监管层质疑,表示要“谨慎使用”;曾被寄予厚望的“大数据征信”,也被认为是伪命题。
业内人调侃自己,一年遭受了“双重暴击”——业务上和心灵上。
2018年,大数据行业将如何浴火重生?
01 行业崛起
2012年,马云在网商大会上震耳发聩地喊出:我们将进入大数据时代。
那一年,阿里巴巴集团设立了“首席数据官”一职,并推出大型数据分享平台“聚石塔”——这是中国大数据行业开始爆发的信号弹。
而大数据行业黄金年代的来临,是在2013年互联网金融崛起之后。
大数据和在线信贷相结合,激发了强烈的化学反应。
在黄金浪潮中,崛起了上万家的大数据供应商,大数据时代真正到来。
这其中,分为几类玩家:
1. 巨头系
如阿里巴巴、京东、腾讯百度等互联网巨头,在自己生态中,积累了多年的电商、社交、搜索等数据,将其挖掘输出。
马云甚至早在十年前就说,阿里巴巴是一家大数据公司。
另外,在细分行业中,也有一些巨头。
如手机行业的华为、小米,都成立大数据公司,将自己生态中的用户数据加以利用。
这些公司,多是自有数据,并将数据进行加工,再输出。
2. 初创系
这一类公司很少自有数据,他们采集数据,进行清洗加工,再输出数据产品。
特别是互联网金融崛起后,催生了大量线上精准获客和风控的大数据公司,如百融金服、同盾科技、聚信立等。
3.国有系
监管部门、大量的国有企业,实际上掌握了大量数据。
但因为一直未打通,数据被困在孤岛中。
一些部门开始授权某些公司获得数据接口,如电信、移动、联通三大运营商都开始搭建自己的大数据公司。
譬如,今年9月底,联通大数据公司宣布成立。
一本财经根据估值、融资和行业影响力,评比出金融大数据的前20强排行榜:
02 行业现状
1.监管来临
2017年的第一个关键词,就是监管。
数据行业混乱,数据买卖在黑市上无限繁荣,这直接导致大量隐私信息外泄。
而电话诈骗“徐玉玉案”,成为一切的导火索。
案件之后,全国的大数据行业整治开始。
5月末,相关知情人透露,“数据堂”等15家数据公司被调查,多家数据公司的业务负责人被约谈,此后,名单扩大到30家。
一本财经在《15家大数据公司被调查,数据行业面临大清洗?》中,曾详细报道第一次监管来袭的始末。
6月1日,《网络安全法》正式实施,被称为大数据行业史上最严法规,非法获取、出售或者提供个人信息五十条以上的,即构成犯罪。
曾经被称为“大数据天堂”的野蛮时代结束。
2.倒闭洗牌
强监管下,行业进入洗牌期,艰难求生。
先是大量的数据接口暂停,“三要素”查询变成只能查“两要素”,学历、车辆、住房、公积金等数据接口被全面切断。
头部数据公司传出裁员消息,“因为业务没有了,大量销售人员被裁掉。”多位从业者称。
这意味着,以前简单粗暴的商业模式已难以为继,各大公司只能谋求转型。
倒闭潮开始,有业内人士预测,90%的大数据公司将无法熬过这轮洗牌。
3.备受质疑
而今年对数据行业的整改,只是业务上的打击,而让行业从业者信心全失的,来自监管层的质疑和否定。
业内称今年遭受了“双重暴击”。
曾经,大数据征信是一个被寄予厚望的概念,认为是中国“弯道超车”美国的加速器。
“与钱有关的才叫征信。”全国人大常委、财经委副主任委员吴晓灵表示,社会诚信与征信是两回事。
算话征信CEO蒋庆军也一直在强调,征信应该指“共享债务人的债务信息”。
也就是说,征信应该与借贷等强相关数据挂钩,而所谓“大数据”等弱相关数据,不应该成为征信的判定维度。
因为,监管和多位业内人士都认为,“大数据征信”是一个伪命题。
而另一个暴击,来自于12月1日,央行、银监会发布《关于规范整顿“现金贷”业务的通知》。
这其中,更是对“数据驱动”的风控模型提出了质疑。
《通知》中要求,加强风险内控,谨慎使用“数据驱动”的风控模型。
“实际上,传统金融机构和监管,对于数据驱动的大数据风控,还不太认同",某接近监管层的知情人士透露,因为这些“高科技”还没有跑完一个经济周期,难以自证完全有效。
这在某种程度上,将大数据行业最引以为豪的部分,给否定了。
03 行业预测
2017年,对于大数据行业来说,就如一叶扁舟,在舆论和监管的浪潮中,颠簸起伏。
尽管大部分从业者对于未来不再乐观,但2018年,依然有几大方向和突围出口。
行业不会就此萎靡不振,浴火方能重生。
1.共享觉醒
现金贷监管之后,此前对自己风控能力充满信心的公司,发现自己的逾期率和入催率在嗖嗖上涨。
行业突然意识到,征信也好,风控也罢,最关键的一步,就是“数据共享”。
所谓“不共享,无征信”。
共享意识终于觉醒,多位从业者和业内专家预测,这将成为大数据行业一个新的风口。
这是打破数据孤岛、解决多头借贷问题的必须一步,同时是征信建设的基石。
但数据共享要做起来也不容易,首先就是要解决“公信力”的问题——证明你不是别有用心,而是独立的第三方,同时又要足够权威。
最近,信联确名为百行征信,8家个人征信试点机构都要参与,就是共享时代开始的信号。
但也有行业专家表示担忧,怕不少机构借着“共享”的名义,实际上做的却是买卖数据的业务。
风口会不会被玩坏,还得看明年监管和行业推进的速度。
2. 数据爆炸
据工信部预测数据计算,2017年中国大数据产业规模近2万亿人民币,2020年增长至5万亿,年复合增速达35.7%。
2018年,数据将产生大爆炸。
第一,人们数据理念的觉醒。
大家开始认为,应该“存储所有东西”,数据呈几何级增长。
一些企业长期囤积数据,但并不知道如何使用。最近,自然语言搜索和可视化工具的出现,可以开始帮助他们优化数据。
这些雪藏的数据即将解冻。
第二,新的技术的推广和运用。
最明显的,就是物联网的升级,新一代物联网设备出现,其传感的数量是原来的5倍,这也意味着,数据的爆炸级增长;
此外,人工智能和大数据行业,是鱼和水的关系。
正因为如此,大家才会将人工智能视为大数据时代的升级。
而反过来,人工智能的发展,将推动大数据行业进入下一个阶段。
第三,一些核心的数据即将开放。
监管部门中,除了工商数据开放外,其他数据暂时未打通。
而最近,却听到了诸多松动的消息。
譬如,公司的财务数据即将开放、商票电子化等等,这些都是判断小微企业经营状况的核心数据。
第四,新的互联网数据出现。
譬如,共享单车、外卖等新的生活方式的盛行,都将打开新的数据洞门。
这些新的数据领域,无疑都是新的沃土,亟待开垦。
03 监管持续加压,洗牌继续
2018年,监管将持续加剧,对行业的清理,2017年之时开了一个小头。
这意味着,2018年,洗牌将持续加剧。
目前,国内的数据公司仍停留在数据的获取、收集阶段,数据的清洗、加工都做得不太好。
因此深耕行业,深耕技术成了唯一出路。
他们只能提供更多附加值,比如,提供更有效的风控模型、联合建模等等方式,才能在同质化的产品中,获得竞争力。
除了技术之外,大多从业者还有一个不太乐观的判断是:要想在这轮洗牌潮中存活下来,还要有自己独家稀缺的数据源。
这是因为,数据获取的难度,在监管之后将大幅度增大。
“现在监管有时会入场查验,比如说你有这些数据,你要证明数据来源合法,或用户授权。”某大数据公司的负责人称。
为了合法取得数据,有些大数据公司甚至开始购买“企业征信备案”,“某大数据公司花了一千多万,购买一张企业备案牌照。”某接近监管层的知情人士透露。
但这一招也不太有效,“因为你只能收集和企业征信相关的数据,无法收集个人数据。”知情人士称。
既然获取新的数据太难,如果只是在原有数据上开发产品,数据很快就会过时,失去有效性。
因此,新鲜的、独家的数据源,成了大数据企业最核心的竞争力。
可见,技术深耕、找到独家数据,才能在这轮洗牌中杀出一条血路。