区块链与大数据是当前出现的两个火热的互联网技术,当人们还没有足够了解移动互联网的时候,大数据和区块链就接踵而至了。
区块链与大数据有着广阔的发展空间,它们之间也不是如平行线般独自发展,而是在各具特色的基础上有着千丝万缕的联系。
区块链技术被很多业界人士所看好,它被认为是现代互联网技术的补充和升级。
区块链技术在很大程度上促进了大数据技术的发展,如果说大数据是信息管理和存储中心,那么区块链就是信息加密和保护系统,它起到了为大数据提供高度的安全性、确保个人信息的私密性、帮助数据实现不同场景下的融合、使得数据更强大等作用。
区块链是大数据的安全载体,为大数据保驾护航。
一、区块链确保数据安全性
区块链的安全性是由它的系统架构决定的。
区块链系统由无数节点构成,这些节点类似于一台台独立工作的计算机,当需要记账的时候,每一个节点都会参与竞争,系统会在一段时间内选出最合适的节点来记账,而这个节点就会在数据区块中记录下近期发生的数据变化,记录完成后,该节点就会把这个数据区块发送给其他节点,其他节点首先会核实数据,数据无误的话,就会把这个数据区块也放入自己的账本当中,于是系统里的所有节点都拥有一个完全一样的数据区块,即账本。
这种记账方式被称为区块链技术或者分布式总账技术
区块链系统节点
似乎这种记账方式冗余且浪费存储空间,并不是一个较为可取的方案,但是这种记账方式能够为数据提供极高的安全性,主要体现在以下几个方面。
首先,每一个节点都是相互独立互不影响的个体,任一节点的损坏都不会影响其他节点的正常运行,因而也就不会导致系统丢失数据,影响系统安全。因为系统在这些节点中选择记账者,而每一个节点的权重又是一致的,所以即使某一个节点被破坏,也不会影响系统的正常运作。
其次,由于每一个节点所拥有的数据区块,即账本数据,都是一致的,因此篡改或者破坏单个节点的账本数据对系统而言没有任何影响。
因为如果出现账本数据不一致的情况,系统会自动认为大多数节点拥有的账本数据才是真实的数据,而那些少数节点拥有的账本数据是被篡改或被破坏过的数据,系统会自动舍弃这些数据。
这就意味着如果想要篡改区块链系统数据,就要控制大多数节点,也就是通常所说的51%攻击。
但是,一般情况下,区块链系统中的节点数量成千上万,能够控制大部分节点的可能性极低,那么篡改破坏数据的可能性也会大大降低,因此区块链确保了数据的安全性。
就像微信群聊中的聊天记录一样,一个微信群可能具有上百个成员,每个人的手机都会有一份完整的聊天记录,如果有人想要修改或删除聊天记录,那他也只能修改或删除自己手中的一份,而不能修改或删除其他成员的聊天记录。
二、区块链保障数据私密性
区块链上的数据本来是公开透明的,所有账户的资产和每一笔交易记录都可以被清楚地看到,这就产生了用户账户数据缺乏私密性的问题,如果某人将自己的账户地址告诉交易的另一方,那么对方就能够通过区块链看到账户的所有资产和历史交易记录。
为了解决数据缺乏私密性的问题,需要使用密码学工具对数据进行加密处理。
常用的密码学工具主要有通道(Channel)、混合器(Mixer)、环签名(RingSignature)、零知识证明(Zero Knowledge Proof)。
1.通道
通道技术的发展得益于支付手段的不断创新,通道实际上是甲方向乙方发起的请求执行包含交易的智能合约的过程。
那么通道如何保护交易双方的私密性呢?
假设Ella和John在进行交易,El-la向John发起了交易总额为0.5以太币(ETH)的智能合约,这个智能合约就是支付通道。
发起合约后,双方的交易和支付操作都是在线下进行,只有Ella和John两人才能掌握交易的各种详细信息。
在交易过程当中,每一笔交易都需要由Ella签名发出,经过通道到达John手中,即使交易额非常小,也需要对方名确认。
通道
在序列号为1的交易中,“Ella:0.499,8”和“John:0.000,2”代表着持有0.499,8以太币的Ella,经签名确认,向持有0.000,2以太币的John发起交易。
序列号为2的交易同理,以此类推,直到序列号为100的交易,最终能够确认在总额为0.5以太币的智能合约中,Ella持有0.382,5,John持有0.117,5。
每一笔交易都需要签名,签名次数越多,交易的时间越长。交易的序列号越大,越能体现出交易双方的近况。
通道内的交易都在链下进行,只有当出现冲突时,才会在链上解决。
比如Ella无法辨认或不承认John的签名,那么智能合约就会认为这笔交易不被双方接受而将其提交到链上处理。
通道既保证了区块链数据的安全性,又保障了交易双方数据的私密性。
2.混合器
混合器是指交易双方将货币发送给一个中心平台,打乱交易关系后再把货币发送到指定地址的过程
混合器
混合器不需要交易双方在链上直接将货币发送到对方指定的地址,因为这样没有私密性可言,而是设置了一个与所有交易方都彼此相连的第三方中心平台,交易方A1、B1、C1、A2、B2、C2只需要将货币与对方指定的地址发送给平台,平台会打乱交易关系,然后把货币重新发送到指定地址。
这样,链上的用户就只知道A1、B1、C1、A2、B2、C2这些用户间发生了交易,却不清楚具体是谁和谁发生了交易。
混合器保护了交易双方数据的私密性,交易地址不会被其他用户看到,但要充分信任第三方平台。
混合器还有很多应用,比如抵抗Sybil攻击和保护隐私的投票等。
3.环签名
环签名是一种保护签名者信息不被泄露的解决方案。签名者拥有着群签名中任意一个签名的签署权,但不能证明具体是哪一个签名。
应用到区块链交易方面,表现为签名者可以具体指定一个交易地址发送加密的货币,而其他用户只知道是群签名中的一个,却不知道具体是哪一个签名。
但是同一笔交易不能出现两次同样的签名,否则环签名的保护措施就失效了。
环签名与混合器组合使用,安全性和私密性更高,因为在使用混合器进行交易时,交易签名的签署权很容易就会得到,和单一环签名技术相比,其组合使用保护能力更强。但要注意,只能签一个名,不能签两个名。
4.零知识证明
零知识证明是目前为止在保护区块链数据私密性方面最强大的解决方案,它难度最高,但是保护能力最强。
一般来讲,零知识证明指的是不需要借助任何数据就能够完成整个证明的过程。
比如有一个不完整的等式,我们需要在不借助任何其他知识的条件下,确定使这个等式成立的数字是什么,填入数字后如果等式成立,那么这就是零知识证明。
表现在区块链交易中,则为不需要借助其他任何外界数据即可完成整个交易流程。
零知识证明
其中,在C和D之间存在一个阀门,并且知道密码的人才能打开,B知道密码并想向A证明,但证明过程中不想泄露答案。
为了实现以上设想,步骤如下:
1)B一直走进洞穴,到达C点或者D点。
2)在B消失在洞穴中之后,A走到B出发的位置。
3)A随机选择左通道或者右通道,要求B从该通道出来。
4)B从A要求的通道出来,如果有必要就用密码打开阀门。
5)B和A重复步骤1)至4)n次。
零知识证明不仅能有效保护数据的私密性,而且还会提供给交易方很多方便,比如追溯每一笔交易,查询每一笔交易发起的时间等。
如果用户希望在不需要了解更多交易信息的前提下验证每一笔交易,那么零知识证明就为用户提供了强有力的解决和保护方案。
目前Zcash代币交易已经使用了零知识证明技术,取得了突出效果。
除了在虚拟货币领域,零知识证明技术在区块链上的发展空间更为广大,因为零知识证明技术几乎能够被用在区块链上的所有应用当中,能够最大化保证区块链去中心化的原则,同时也能极大保障交易的安全性和私密性。
零知识证明保护隐私的能力极强,因为除了唯一正确的数据,其他任何数据都无法破坏交易。
但是零知识证明技术目前并不完善,它也存在着一些明显的缺点,比如生成效率低、需要信任支持等。
相信在不久的将来,零知识证明技术的缺点会得到有效修正,它会成为在区块链中使用最广泛且最强大的技术。
三、区块链保护数据相关权益
在大数据行业日渐成熟的时候,数据资源的价值得到了所有人的认可,那么大数据作为一种新型资产带来的相关权益保护也就成为了大数据行业的重要事项。
在保护数据相关权益方面,区块链有着突出的能力。
数据资产的所有者可以在区块链上进行资产注册,明确大数据的源头,并对数据的所有权、使用权进行明确的规定,防止数据被侵权使用。
在实践应用上,区块链也已经被许多公司运用在了保护数据相关权益上,尤其是以数字作品为代表的数据版权方面,Primas平台就是旨在保护优质内容和作者权益的开放式社区平台。
公司技术团队主要致力于使用区块链和其他技术手段加强对网络内容的溯源和筛选,既使用户获取到优质的内容,也帮助原创内容进行版权保护。
利用区块链技术,发布在Primas平台上的原创作品会自动生成一个全球唯一的数字ID :Primas DNA。
根据数字ID,原创作者可以方便地查看平台上自己作品的使用去向,一旦侵权事故发生,作者维权也变得有迹可循。
除此之外,因为不需要中心化平台保护作者版权,区块链技术还能够帮助作者直接通过发布优质作品获取收益,不用担心中介平台拿走大部分收益。
通过Primas的案例,可以发现区块链在数据权益保护方面的优势主要体现在以下两个方面:
1.区块链能够破除中介复制数据的威胁
在大数据交易过程中,传统的中介交易方式会带来中介复制数据的威胁。
数据资源和传统实体商品不同,具有“复制即拥有”的特性,中介的存在会对数据所有者的利益产生极大的威胁,而这种威胁仅靠口头的承诺无法消除。在区块链上,由于没有中介平台的存在,数据不会有被第三方复制的隐患,数据生产者的合法权益得到了保障。
2.区块链破解数据确权难题
区块链为数据资源提供了可追溯路径,能有效解决数据确权的难题。
在区块链中,网络中的多个节点共同参与了数据的生成和使用记录,并且节点之间会互相检验验证数据信息的有效性,既可以防止数据被篡改,又提供了数据资源的可追溯路径。
把各个节点记录的数据流通信息串起来,就形成了这笔数据完整的流通明细清单,数据的源头也变得清晰明了,数据资源的确权变得简单。
对于价值重大但所有权等相关属性在传统交易模式下易受到威胁的数据资产来说,实现相关权益的保护需要从新的技术手段入手。
利用区块链技术,数据资产的所有权变得清晰可查,在交易时也不再有第三方中介进行复制操作,能够全面保障数据生产者的相关权益。
在区块链上对数据进行注册确权,后期数据的交易记录将会是全网认可的,而且受到全网的共同监督,透明可追溯。
即使发生了数据的侵权事故,清晰的记录也将会使维权事宜变得简单明了。