“要弄清区块链和大数据的关系,首先要从两者的不同开始。”从事互联网技术研究20余年,人称互联网技术相面师的中国信息通信研究院云计算与大数据研究所所长何宝宏抛出了这一观点。他认为,区块链和大数据技术存在一定的共性,但是两者在技术处理方式上,更多的是不同。
何宝宏 中国信息通信研究院云计算与大数据研究所所长
何宝宏表示,区块链技术是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式,区块链处理的数据更小,是细致的处理方式。而大数据管理的是海量数据,要求广度和数量,处理方式上也会粗糙,重点是统计分析(如下图)。
“这个时代***的特点就是变化。”对于区块链的兴起引发的业界的讨论、思考和担忧,何宝宏认为,我们擅长关注变化的东西,但是实际上很多变化背后的一些东西是不变的,比如——技术的规律。因而,在探讨区块链和大数据的关系时,我们需要跳出技术看技术。
客观而言,作为一个颠覆式的新兴技术,区块链要应用在大数据场景下,其本身还还不够成熟,需要进一步的研究而探讨。而区块链是否可能重构大数据?何宝宏认为基本不存在这一可能,因为大数据针对的是非结构化的数据,而区块链处理的是结构化数据。“两者的目标数据不同,要解决的问题也不同。”
在4月18日-19日即将于北京国家会议中心召开的“2018大数据产业峰会”上,何宝宏将发表题为“预见大数据的2018”的演讲,就大数据、区块链等技术发展背后的规律,以及2018年的市场动态和趋势进行展望。下面,小编收集了何宝宏博士近期的精彩观点,供大家提前养养眼、洗洗脑。
区块链:互联网的“大补丁”
草根、全球、自治、分布、开放、透明、对等、匿名、分享……二十年前,人们如此形容互联网;今天,这些却成为了区块链身上的标签。
这是为何?“区块链是互联网的发展和延续,是互联网的一块大补丁。”何宝宏认为,区块链颠覆不了互联网,更颠覆不了世界。如果非要认为区块链可以颠覆世界,只能说那可能是你的世界太小了。
要为区块链相面,我们能发现很多问题,如:性能低、能耗高、生态链、安全防护、隐私保护、监管缺失、标准缺失、不务正业等。“以我20多年的互联网相面经验来说,但凡是有这些问题的技术都是‘好技术’,这些缺点随着时间的推移都是可以克服和解决的。所以,每当有人批评区块链这些缺点时,我都会说这是优秀技术的典型特征。”
相比较区块链这样的颠覆式技术,何宝宏认为那些注定要失败的技术往往具备以下特征: 1、声称包治百病,一句话说不清楚它希望解决的具体问题;2、概念模糊,一句话说不清楚它的基本思想和原理,与现有技术的明显区别或边界;3、准备从主流市场,***钱的市场或存量市场开始;4、需要建立以我为中心的生态链(技术富二代除外);5、看起来过于***,没有明显的取舍,回避需要付出的技术代价;6、不考虑摩尔定律是否支持;7、经济学规律模糊,历史案例牵强。
区块链的本质是分布式账本。何宝宏认为,分布式账本是“刚需”。过去的几百年,我们一直在使用集中式的记账方式,没有一种手段能够支持高效的分布式记账,直到区块链的出现。
“成年后的技术大多活成自己讨厌的样子。”区块链的特点是去中心化、防篡改、匿名性,但是随着其不断成熟和落地,这些特征需要从更深层次去理解。
分布式≠去中心
分布式不等于去中心。“高喊去中心的大多数是自己想成为新的中心。”何宝宏以比特币为例,其代码控制在Core小组手中,算力是高度集中的。同时,有报告显示,40%的比特币实际上是集中在1000个人手里,而另外一个报告则说,96.53%的比特币归属于4.11%的地址。因而,随着区块链的发展,去中心正在变成多中心。
防篡改≠不可修改
防篡改不等于不可修改。在何宝宏看来,人会犯错,数据因而也会出错。在会计体系里,不允许做假账但是允许改错账。在传统的数据库技术中,修改是很容易实现的,因而需要一些管理手段来防止篡改。但是今天,区块链技术是不可修改,那么如果数据出错了怎么办?因而需要在不可篡改的技术上加上“可修改”。
保护隐私≠匿名
保护隐私不意味着一定要匿名。何宝宏认为,匿名是保护隐私的一种方法和手段,但不是绝对。二十多年前的互联网是匿名的、全球化的,谁也关不掉,共享且自治。然而,到了今天,登陆一个网站,你就需要输入验证码,以证明自己是人,而不是机器或其他。
对共识机制难有共识
“对共识机制,难有共识。”何宝宏说,我们需要共识,但我们的共识机制本身却是分裂的、碎片化的。我们用POW比谁劲大,用POS比谁钱多,这是典型的从原始社会过渡到资本主义社会的“玩法”。后来钱多了人也太多了,于是又用DPOS搞出了代理人机制。
共识机制如何形成共识,属于控制层面范畴,这个共识特别难。要有这样的共识就必须要有共识之母,一个共识前面还得有一个共识才能形成后面的共识,共识也是链式结构的,信任也是链式结构的。因而,说区块链是去信任的,那是不可能的。
小产业、大变革
从技术的角度上看,区块链就是将原来的单个账本变成了现在的多个账本。原来,所有的数据库之间是主从关系,账本只有一个;今天多个数据库之间是对等关系,账本从一个变成多。
从一个会计到多个会计,以前记账可以读、写、改、删,今天记账只有读和写;以前记账要给会计发工资,进行外部激励,我们今天自己激励就可以了;以前所有公司的商务和财务都是分离的,付账过程特别繁琐;今天的智能合约是商务财务一体化,这就颠覆了我们很多的想法。
以前,代码就是技术;今天,代码变成了金融产品,所以就出现了新的机会。以前,数据主要是指信息,技术则就是如何帮它更广泛的传播;现在数据越来越成为资产,技术的走向就要发生很大的变化。
以前,二进制代码表达的是信息;今天,二进制代码表达的是一种财产。数据即资产,资产即数据。当二进制代码代表资产,技术的核心要义就要走向保护,要去管理和控制。技术的目的从***限度的传播,转为考虑如何把代码圈起来。
区块链是小产业、大变革。它颠覆的是我们的经济、经济运营***层的复式记账法。我们用了几百年的复式记账法将演进为三式记账法。