大数据交易平台发展迅猛
大数据成为创新经济的引擎,基于大数据的产业异常活跃,各地政府都把大数据当做经济转型的重点,也把大数据作为“弯道取直”,实现后发赶超,获得跨越式发展的机会。于是,很多地方联合企业主导的大数据产业园,大数据交易中心纷纷成立:
面对各地蓬勃发展的大数据交易中心,大家都很谦虚,都在说探索,那么什么样的数据共享交易机制才有利于数据的流动呢?
数据企业对大数据交易平台并不感冒
接触过不少大数据企业,通常都会问负责人同一个问题:你们的数据会通过数据交易中心提供服务吗?得到的回答也几乎是一致的:怎么可能?凭什么?
听到这种回答,我们也不禁要问:为什么?
在商品经济时代,商品交易平台,无论是线下的大卖场模式(国美、苏宁),还是线上的商城模式(天猫、京东)都加速了商品的流通,对经济发展起到了巨大的推动作用,即使收取很高的费用,商家也争先积极入驻商品交易平台,平台也取得了巨大成功。
大数据交易中心目标同样是链接供需双方,加速数据流通,园区也建了,优惠政策也给了,并且还免费进驻,为什么数据企业并不买账?
数据企业不敢把数据拿出来共享交易的担心有两方面:
1.数据合规性。什么样的数据可以共享和交易?数据需要处理到何种程度才可以共享和交易?数据拿出来会不会被投诉或者处罚?这些问题困扰着数据拥有者,谨慎的数据拥有者为了规避风险,不求有功,但求无过,索性就不拿出来。
2.数据安全和权益保障。数据在共享交易过程中,存在被第三方复制、留存,转卖等风险,数据资产权益无法得到保障,数据共享可能就是在为他人做嫁衣,收益风险比太低,不值得把数据拿出来共享交易。
数据商品具有特殊性
通常的商品,不管是实物商品还是虚拟物品,都有一个明确的所有权约束,获得所有权,就能唯一拥有商品,享用商品带来的价值。商品交易和交换,是商品所有权的转移的过程,在所有权转移之前,任何一方观看、托管甚至试用都不会真正拥有商品,这些过程也不会对商品提供者造成实质性利益损害。
相对于普通商品,数据具有其特殊性:
1.无唯一性,没有明确的所有权约束。普通商品具有唯一性,同一时间只能有一个所有者,所有权与唯一性是相关联的。数据商品不具备唯一性,可以同时交易给多个对象,也就没有了传统所有权的概念。
2.看过即拥有。传统商品的所有权都有一个显式的、公认的证明,比如房产证、股票账户,交易的安全就是顺利保障所有权的转移。数据商品没有了传统所有权的概念,交易流程少了一个关键的卡位点。而拥有数据商品也更为简单,成本更低,看过即拥有了数据商品,就能获得效用。
3.数据复制的完全无差异性。普通商品也存在复制和盗版,但复制品和盗版在效用上是与原商品有着巨大差别的,比如仿制的汽车不如原厂汽车质量好,复印的画不如原版画价值高……,而数据产品的复制具有完全无差异性,在效用上也没有差异。
数据商品如此简单就可以拥有,如此简单就可以被复制,应该用什么样的方式来保护流通呢?
传统交易平台成为数据交易威胁
我们来看一下当前数据交易中心的交易模式:
•托管交易模式
数据机构将需要交易的数据托管到大数据交易中心,购买者与大数据中心进行数据交易。
•聚合式交易
数据聚合中心通过API接口将数据业务机构链接起来,业务机构无需事先将数据上报给中心,数据由机构自己管理。当某个主体需要查询数据时,通过中心与数据机构实时交互,有数据的机构回应信息,由中心统一返回给查询机构。
上述传统的交易模式,针对数据安全和权益保障,交易中心会举出一系列安全措施和保护方案,如机房先进,多地存储,多层防护,人员分权等等,表明数据在交易中心很安全,不会被其他人窃取 ,多么厉害的黑客也很难攻入。这些措施都是必要的,但这些措施制设计时,都是针对其他第三方,对于中心自身是不设防的,中心有能力、也有机会留存交易数据,也就是中心自然变成了数据的拥有者,可以对数据做任何处理,包括转卖,再加工,再增值……。
交易平台往往都是把自身作为权威、可信第三方,表明自己不愿也没有动力去留存数据。但无法做和不愿做是两个概念,无法做是想做但做不到,不愿做是有能力做但没去做,一个是不具威胁,一个是具有潜在的威胁。
因此,从某种意义上讲,数据交易中心形成了对交易双方的潜在威胁,也成为数据交易的一个障碍。
怎样消除中心的潜在威胁?
需要从机制上保障交易中心没有机会复制、留存数据,从不愿做变成无法做,让交易双方放心,具体要做到:
1.对购买者放心:
•数据产品合法化,规范化,可预期。
•交易要保密。信息查询或者购买行为本身就是隐私,不能被广播、被无关机构获知,仅数据提供方知晓。
•交易要精准。一旦发起交易,必定成功。
•交易有保障。交易行为有记录,可查询,可申诉
2.对提供者放心:
•数据由提供者存储和管理,谁的数据谁控制。
•交易过程中,数据仅能被购买者获得,其他任何第三方,包括平台,也无法获取数据。
•数据购买者无法在平台上将购买的数据再次交易。
•购买者的购买需求会准确传达,不会被平台过滤和转向。
•交易有保障。交易行为有记录,可查询,可申诉。
实现放心的平台,需要强有力的技术支撑和严密的运行机制:
1.正确运用加密技术
一个系统不是用了加密技术就代表了安全,更重的是是否能正确使用密码技术,密码技术的正确使用包括两个方面:
•密码算法的正确使用。单独一种密码算法很难有效保证整个系统甚至某个应用功能的安全性,需要对多种算法进行有效组合,比如身份确认可以使用非对称加密,不可逆可以采用HASH算法,大数据量加密采用对称加密,不可抵赖和篡改使用数字签名,定向加密采用数字信封等等。即使使用,不合理的组合也会导致漏洞。
•流程的正确使用。完成整个业务的安全必须在各个流程中正确使用加密技术,在数据共享流程中,至少要包括:
»密文索引
»密码查询
»密文获取。
正确加密技术的使用目标是每一笔交易都不可抵赖,都可以追踪,中心平台无法获取数据内容。
2.引入区块链技术
区块链是一种分布式的、完整的、不可篡改的、多方参与和监督的记录方式。将数据交换使用区块链记录,可以让所有机构公平参与,中心平台的操作也变为透明和可监督,可以让中心成为随时可监督,可抛弃、可替换的服务者,每个参与者也可自成中心。
弱化中心功能,让中心成为服务者而不是控制者,这是区块链技术最大的贡献。
3.开放与开源机制
无论多么完善、多么NB的机制和体系,都挡不住实现过程中的小“技巧”(漏洞或者后门)。表面上说的再好,最后的实现是黑盒,还是无法用参与者放心,因此系统进行了协议开放和代码开源。
•协议开放。系统对交互的协议和数据格式公开,参与者可以自行技术实现相关组件加入体系,确保自身数据的安全可控。
•代码开源。系统为参与者写好了数据接入模块,源代码公开,让用户看的清清楚楚,也证明系统的清白。
敢于协议开放和代码开源,本身就证明系统的透明和安全。
4.严谨的流程设计
机构0向交易平台密文公布共享数据的索引。密文为单向散列算法,只根据密文无法推导出原文,谁也不知道机构公布为了什么!信息没有泄露风险。
•机构1将要查询的用户ID使用同样加密算法加密后,在加密索引中查询。加密索引通过图块链实现,任何人都可以下载查询,因此查询动作和查询信息都不会泄露给其他机构。
•机构1向可以提供数据的机构4和机构6发送数据获取请求。请求只发送给能够提供数据的机构。
•机构4和机构6收到请求后返回数据,数据使用机构1的公钥加密加密后传输给机构1。收到请求的机构必须应答,因为已经在索引中进行了声明,无法抵赖。
•机构1分别收到机构4和机构6发来的加密数据,使用自己的私钥解密数据。使用查询机构的公钥加密,只有查询机构能够解开,其他任何第三方无法解密。
去中心功能,做服务型平台
保护交易对方的权益,交易中心不仅仅是不能侵害交易方权益,同时也须避免对交易方的权益形成威胁。
对于当前数据交易中遇到的数据合规性问题,交易中心不是等待问题自然解决,不是袖手旁观,不是看着数据企业孤独的奋斗,而是应该利用自身的优势,与数据企业一同开发数据产品,制定数据规范,共同促进,共同承担。
对于数据交易中数据权益保障问题,把交易双方的权益放在第一位是交易平台的重中之重,交易中心除了保障数据不被其他第三方侵害,也不要让自己成为数据的潜在威胁者,需要放弃原有强中心模式,通过加密技术、区块链技术和开放开源的结合,从机制上保证交易中心自身无法复制和留存数据,让数据交易双方放心,同时要能起到交易公证、监督、追溯等管理职责,切实为交易双方服务。
让中心自己去掉中心功能,真的是有点难,但是,欲练神功,必先自宫,为了数据交易的蓬勃发展,你准备好了吗?
作者简介:韩洪慧,上海凭安网络科技有限公司、上海凭安征信服务有限公司 联合创始人。12年的信息安全从业经验,4年的大数据征信从业经验。专注于网络身份认证、电子签名、数据安全、隐私保护、网络取证等领域研究。