日前,明略数据董事长吴明辉在 《中国大数据应用前沿调研报告暨大数据技术精锐企业图谱》发布会上就《中西方大数据图谱对比看中外大数据产业发展差异》进行了精彩的主题演讲,以下是此次主题演讲原文。
图:北京明略软件系统有限公司董事长 吴明辉
各位来宾,大家下午好!非常荣幸明略数据可以与***财经研究院联合发布大数据产业报告与图谱。
大数据产业链上,产业图谱的意义是非常重大的。我在09年,做秒针的时候***次接触到图谱,是一个美国数字广告产业的图谱。在看到这个图谱之前,我 对秒针未来几年的发展走势还非常困惑,在看过之后,我就发现原来在美国整个数字广告、数据营销领域已经有了那么多细分领域,秒针也就找到了方向。所以在去 年年初,创办明略的时候,我也一直在思考:大数据领域在未来毫无疑问是全世界的发展趋势,这个领域在中国创业到底企业定位应该怎么选择?今天中国的市场发 展到底是什么样的?所以中国大数据产业其实很需要这样一个图谱。
今天我给大家分享的内容主要是对比一下看看我们中国的图谱、中国大数据产业跟欧美发达国家的图谱有怎样的差别,中国大数据产业到底有什么自己的综合特点和特殊的机会。
中西方图谱差异
大数据图谱对于企业、创业者,对于制定公司定位都是一个非常好的指引。每一个企业在选择自己工作内容和自身定位的时候都要有对市场的全局观,这个图 谱就提供了一个很好的全局观的指引。同样,图谱也是整个中国国家大数据战略布局的产业化表现形式,通过图谱可以直观的看到产业组织内企业的发展情况。
具体来看中国图谱和美国彭博社图谱的区别可以看到,在美国或者说全球大数据市场已经有非常多的公司,领域内的分布更加细化,分工更加明确。今天中国的大数据市场,到目前为止,还没有分工的那么明确,细分领域相对还没那么多。所以这次图谱的总结、归纳是把整个中国大数据公司归为了六类,这个归类的方式跟欧美的图谱也是有一些区别的。
***个区别体现在整体布局。在西方大数据图谱里,大多数公司或者说几乎所有的公司都是纯技术公司。而在中国新 发布的图谱里,公司属性有两个维度,一个是技术,另外一个更重要的纬度是数据。DT、大数据的概念几乎尽人皆知,我个人倒是比较认可数据技术的这种概念, 实际上也没有所谓的真正的大数据还是小数据,本质上来讲,大数据是一个我们更加专注于去挖掘数据价值的这样一个过程。通过技术和数据这两个纬度,可以更有 效并清晰的区分企业各自的分工和各自的价值。数据这一纬度的建立是因为在中国,传统的数据公司、数据技术公司就少,到了今天这个大数据时代,这些公司才真 正的涌现出来,并且出现一批新的企业,像明略这样的企业,对数据本身起到了很多作用。在美国,数据技术不是在大数据这个概念出来才出来的,它是在过去十 年、二十年甚至是一百年的历史上,从有科技公司时候,就已经开始有很多人在数据领域做事情,而中国其实真是到了今天这个时代才有了这么多的公司,开始以数 据为主的业务,做自己的生意。
另外一个纬度是图谱里企业的特点。在西方图谱里更多的是技术公司,这些技术公司从传统的数据技术公司转变成今天的大数据公司。也就是说在美国,传统 技术公司里已经有很多公司聚焦在数据方面。而在中国的技术领域里,更多的传统IT企业几乎是不碰数据的。比如,以前银行的数据库几乎没有国产的,全都是大 家知道的IBM、 Oracle、 EMC。真正内核的接触到数据的服务几乎都是国外的软件厂商在提供支持。中国的传统IT企业,以前只是在做应用程序、系统集成这样的一些工作。今天很多传 统IT公司在大数据时代也开始朝大数据公司看齐,在从一个IT公司成为一个DT公司。图谱里仔细严谨的筛选了这些有所转型的传统IT公司,现在呈现在图谱 上面的公司真正的主营业务都是做数据生意的。如果一个IT公司只是打着大数据的旗号,到处说我们也是做大数据的公司,都会从图谱上被毫不留情的去掉。同 时,在这个图谱上,大家也可以看到一些非常年轻的公司,包括明略。在中国,真正聚焦在数据,包括数据挖掘上的科技公司非常少,但在今天资本市场非常活跃的 时间点,有很多初创大数据企业在短短几年里就涌现出来并且在市场上已经获得了很多的客户认可,得到了很多商业机会。
具体说到数据的部分,大家可以看到,整个中国的数据环境和西方的非常不一样。我前面讲到,在以前,中国对数据的使用并不多。而在西方国家,尤其是发达国家,比如德国,在十年前就开放数据接口,发布数据开放标准,在1977年就已经颁布了本国联邦数据保护法律。因为西方国家比较完善的法律法规和行业指导规范,他们的数据使用也是比较规范的,这也使得在所谓的大数据到来之前,西方国家已经有了很多数据应用,比如在金融领域的风控与征信。在大数据概念出现之前,西方国家就已经有了很好的生意(商业)模式,而且这些更多的是由政府主导的。而就中国整个发展来看,在目前的中国市场上,数据相对还是比较封闭的,政府数据现在还没有完全开放出来。当然我们也很高兴的看到很多地市、省政府也逐渐开始通过与企业的合作建立数据开放平台,在这个过程中,图谱上也就涌现出来一些专门做政府数据开放、数据交易的公司,我们称为“数商”。这在数据交易上会起到很多作用,是一个很不一样的地方。
从技术角度来讲,中国公司跟西方公司区别也很大。如果仔细去研读彭博社的图谱的话,其在技术领域里是用技术的分层来去分析的,有些公司专注于做技术 底层,基础建设这一层;有些纯技术公司做上层应用开放,统计分析软件的;甚至还有大量机构和公司专注于开源技术系统搭建。在中国,大家通常做一家科技公 司,更多的***件事情先是复制美国的某一个公司或者复制美国的某一个业务,这样的话很容易被资本市场认可。这也导致中国没有***层的核心技术公司,至少在 早期是没有的。包括今天,在与硅谷工程师的交流中,大家都觉得中国的纯技术公司也有,但是很少,华为是一个,在全球都做了很多的纯技术、纯底层技术投资的 一家中国科技企业。但是更多的中国科技公司是在做应用,包括BAT。当然中国做应用的能力是非常厉害的,很多应用已经超越了西方国家了。但就纯底层技术来 讲,我们还需要更多的去学习。美国在纯技术层面已经领先我们了,而且以前国家对国产软件企业、IT公司的支持力度也很有限。更多的客户采用拿来主义,使用 美国的成熟技术直接去做自己的应用,而不会耐心的等待中国IT公司做自己的技术研发。但今天,国家已经把整个大数据发展变成了***战略,我们有更多的机 会,更多的耐心去等待国产软件企业发展。我们遇到了很好的时机,开始逐渐积累中国自己的核心技术,甚至有机会把技术输出到海外,做到中国创造。
中国大数据产业环境
从中国大数据产业的环境看,中国在为大数据企业创业提供***的土壤与环境。中国拥有全世界最多的人口、全世界最多的智能设备、全世界最多的产生数据 的IT系统,这意味着中国一定会产生全世界最多的数据。 在中国做数据技术就会遇到可能超过全世界任何一个其他国家的数据规模。这的确意味着很多技术挑战,但也意味着很多大数据机会。国家已经密集的发布了一系列 政策、纲要支持本土软件企业的发展,这不单单是数据技术公司的机会,更多的是中国科技公司、IT公司的机会。中国IT市场内公司的投资也许并不会加快很 多,但整个蛋糕里属于中国公司的机会越来越大了,属于中国公司的市场份额可能是在以每年25%,每年35%的速度增长,这无疑是一个非常好的时机。
整个中国的大数据产业会涉及到数据,数据本身又涉及到真正消费者的数据安全、数据保密,这里面实际涉及到很多法律法规问题。由于这些法律法规是新出 现的问题,同时伴随的很多机制不完善,所以这里边很多公司可能是处于一个隐瞒增长的状态。我们需要更好的市场化规章制度,包括政府引导的、行业自制的协议 以及将来的立法程序。这是整个市场必要的发展过程。
大数据在中国还有一个很重要的契机是人才。整个IT人才的发展是伴随着互联网的发展而起。从图谱里可以看出,更多的大数据企业是2B的性质,他们面 临的共同的挑战是跟人才竞争更加激烈的2C市场争夺人才。这背后的一个原因在于中国纯底层技术的公司受到的一些限制。但在最近的一两年,2B公司其实也逐 渐开始得到市场的认可。之前在美国,2B公司很容易融到钱,在中国基本上是融不到钱的,但最近已经有很多资本市场开始认可了这个方向。因为整个中国的劳动 力,尤其是中低端劳动力成本已经逐年升高,导致很多企业不愿意雇佣更多的人,而是希望用IT技术,甚至是DT技术替代人。以前IT可能替代的是机械劳动, 那未来可能DT可以替代需要智慧的劳动,比如股票分析师。这整个过程与转变,让资本市场愿意在2B领域投资,让中国的很多大数据企业得到契机。所以人才是 在整个科技创新过程里最核心的一个要素。
数据资产管理
按照图谱的逻辑,再说一下中国企业的机会。我在很多论坛上分享也提到:今天中国的数据仍然是一个“裸矿”,需要被开采的。但在开采过程中,如何能够 更安全的去开采,就像明略的英文名“矿灯”一样,要有安全防护技术才能安全的开采出价值。我们需要法律法规、规章制度保证数据开采的安全性。 目前因为法律法规的缺失,市场上有很多的“数商” 在进行灰色交易。 像我之前认识的一些公司在运营包含大量隐私的电信运营商的数据。运营商自己也想去做数据变现、数据整合,但一方面由于相应制度、法律法规的缺失,组织架构 的不成熟和很多客户对数据的需求,比如营销领域、金融领域的需求,数据在没有通过合法合规渠道就进行了买卖。很多情况下,就是跟某一个省公司、地市公司直 接签一个协议就把这些数据买走了,过程中没有考虑到数据隐私、数据脱敏的问题。真正发掘数据价值就必须找到安全的机制,保护好数据隐私,做好数据脱敏,同 时又能够让数据使用者更好的用到数据。明略最近就在做一个相关的项目,我们联合运营商和银行,把运营商的数据运用到银行领域的风控与征信。为保护消费者隐 私和数据安全,明略在中间扮演了一个黑盒子的角色。 数据放在这个黑盒子进行加工计算,将数据加工、模型运用,使银行用户能够将数据应用到自身的贷款业务中,但却没有看到原始数据,数据使用完之后,立刻清 空,不存储,不落地。 这就好比支付宝在整个电子商务扮演的角色,让数据提供方和购买方真正安全放心,同时保护交易者隐私安全。
数据技术
整个数据技术在中国的发展。新技术的前沿性发展多是跟随美国和西方的发展。尤其是像硅谷,每一个工程师,每一个企业都努力创新,而且这些创新很多情 况下是领先市场需求的。可能新技术在当时没人使用,在之后10年,20年才有人用,但他们仍在不断的付出自己精力进行创新。整个中国的技术发展则更多的是 被动的,甚至有了需求,可能还没有技术。这个时候再去补技术,很有可能就正好从美国复制过来。但可以想见,今天单凭复制已经不能满足需求。中国面对的数据 量可能比美国还大,面对的计算挑战可能比美国还多。在最近几年里面银行业经常出现系统宕机的情况就说明,在美国成熟运行了很多年的包括IBM、 Oracle的大型计算机也支撑不住中国消费者的金融交易。阿里通过自主研发应对每天比一个大的银行还要多的数据量,这就道出在面对中国数据挑战的时候, 技术是要源自于中国自主知识产权的,真其实是需求被动的带动出来的技术创新。所以我相信未来的一段时间,在纯技术的领域里、在数据技术领域里,我们可以从 中国制造转向中国创造,而且很可能有一天我们可以把中国的技术输出出去。
前段时间我和某航空公司老总聊天的时候,他说希望把公司打造成一个专注于服务航空公司的云计算、大数据平台。这个平台他们愿意和明略数据联手开发。 目标很简单,希望把服务自有航空的整个运营包括:服务消费者做营销,做售后服务的技术能力打造得具有对外输能力,不光服务自身而且可以随着国家一带一路的 发展方向,服务周边国家和他们的航空公司。可能以后有人建航空公司直接到他们买这个打包服务就行了。所以大家可以看到,我们未来是非常有机会输技术能力 的。因为中国在未来面对的挑战是***的,我们的数据量是最多的,所以我们确实是在中国市场上是有机会积累自主知识产权的技术的。当然从技术公司的角度来 讲,我们更加希望政府加强知识产权的保护。因为在大数据领域里可能会有不同类型的公司,有一些公司他们可能是一些数据寡头,像BAT,有很多的数据资产, 因为他们服务最多的是消费者,是网民,从而记录了很多数据。在这些数据上未来会有很多创业机会、创新的机会,很多科技公司可以在其上经营数据,挖掘数据, 开发数据模型。但是中国知识产权保护体系是不保护“数据模型”这个概念的,而这在美国是可以被得到保护的。所以,如果国家希望有更多大数据企业的创新,不 一定是垄断数据资源,而是在数据资源上做自己的服务模型,就需要保护这种知识产权,保护好这种公司的创新劳动成果。如果能够把这些有一个体制上的升级,对 于中国未来大数据创新是有很大促进作用的。
大数据企业
***我们再看一下中国大数据企业。我们今天的企业相比于西方国家企业的数量还是少的,但实际上,市场上宣称自己是大数据公司的并不少。但是在行内人 来看,如果你的主营业务跟数据没关系,就不能算作大数据企业。同时我们的市场刚刚起步,企业细分、定位并不是十分明确,很多公司都是什么都做。所有在这里 中国大数据公司分成六类,而西方的图谱里有几十个框,而且这一张图谱背后还有一系列图谱,有每个细分的领域里的图谱。中国在这六类领域里有长期发展的潜 力,就像这次发布的报告里调研出的结果,中国对大数据技术的需求已经越来越旺盛。这些领域里未来会涌现出更多的公司,公司之间也可以建立更好的合作,找准 自身定位。
细分的定位对中国大数据市场的健康发展是非常重要的。大家都知道在中国我们的生意模式跟西方不一样。以前听过一个笑话,说中国人做公司跟犹太人做公 司的区别是什么。犹太人做公司是如果只有一条街,有一些客流量,有一个企业家过来开了一个饭馆,挺赚钱,这时候第二个企业家进来他就不会开饭馆了,就开理 发店了,第三个企业家来了他可能就会做洗衣房,第四个企业家就做其他的服务行业,大家和平共处行成这个产业链,形成一个生态系统。而中国的企业家来,*** 个企业家开一个饭馆,第二个企业家过来一看,哎,开饭馆不错啊,很赚钱,就又开了第二家,第三个企业家还是在开饭馆,***这一条街有100家饭馆,大家都 不挣钱,就全都倒闭了。我们特别不希望在大数据这样一个对国家战略那么重要的一个市场上,企业都去做一模一样的事情。作为企业之一,我希望每一个企业都自 己的细分市场的位,因为客户本身的需求也是多种多样的,大家不应该去恶性竞争,应该找到自己企业自己的团队独特的价值,独特的基因。有人可能专注服务数据 的提供者,有人专注服务于数据的需求者,有人专注于做底层技术,有人专注于做行业的解决方案,大家应该是有自己的分工的,这样不管是资本市场还是日常服务 的销售都会处在健康的良性竞争,每个企业都能产出利润。大家都知道当你和另外一个企业做一模一样的事情,***一定会陷入***价格战,而软件这个行业本身毛 利也是很高的,这个价格战也可以打的很凶,我看到很多软件行业的招标,***成交价格是客户预算的百分之十,这种无序的竞争***一定是会伤害到整个行业。没 有利润就意味着没有钱投入到未来的持续创新里,也就意味着产品肯定会变成粗制滥造的产品,不会做的越来越好。所以图谱对每一个企业在整个中国大数据市场内 找到自己定位,研究其他人的定位都有非常重要的意义。
那到底像明略,我们的定位是什么?我们希望服务于大数据的需求者,客户,真正帮助他们搭建一个完整的大数据应用平台,帮他治理自己的数据,同时帮他 去找到外部数据,这些数据可以从数据源直接找到,也可以从“数商”进行数据交易的数据方,交易平台找到,帮他整合数据,清洗数据,真正把数据应用到自己的 业务里发挥价值。这是我们在这个市场上期望承担的角色。我们也希望能够跟着这个图谱越走越远,像大数据发展纲要提到的,扶持中国十家大数据龙头公司,支持 中国产生五百家各个领域里、各个行业特殊方向的服务商,应用商。我也希望未来图谱里的企业公司越来越多,希望今天这五十家企业将来都能成为十家龙头之一, 都能成为那五百家企业之一,同时我希望每一个企业不要去恶意竞争。
视频地址:http://v.qq.com/boke/page/o/0/0/o0166d8fp90.html