当我们谈到数据价值的时候,需要先计算一下数据的体量。如果每一个人一次消费产生80byte的记录,每人每天按5次消费计算,仅仅计算2亿的中国城市人口,就会发现每天产生的消费记录数据为80GB,按照互联网数据公司3个月左右开始画像的话,则是7.2TB数据。那么在消费次数、消费人数、数据积攒时长增加的时候,这类数据会以很快的速度达到PB级别。
这些数据能够被一般意义上的区块链系统存储并处理吗?不能。一般意义上的区块链系统,或者说大多数的公链,它是这样一种分布式系统:系统中的每台计算机都需要存储同样的文件,以保证系统的功能。显而易见,它们是无法提供PB级别的存储空间将数据价值保留在上面的。
所以我们需要将数据存储在分布式存储系统中,再通过区块链的结算功能性实现数据价值。简单来讲就是将存储部署在分布式存储系统中的同时,将状态留在区块链上,以待之后的处理和使用。
这其中,分布式存储是指通过不同的加密方式把数据存储起来,确保数据和链上的账号一一对应,在未来的使用中,利用不同的加密计算工具对数据进行快速的调用和处理,而在数据制造和计算时,都可以做到半匿名的方式。结合了区块链来存储数据,在密钥的功能性和本地私密性之外,能够增加额外的处理功能接口,以满足数据分享和计算的需求,从而帮助数据更好地分发和拓展,实现数据的价值。
只有将区块链系统与分布式存储系统这两种分布式系统相结合,而不是单纯地只使用区块链系统,才有可能实现数据的价值。
不过,除了区块链系统与分布式存储相结合实现数据价值的方式之外,我们还可以从另一个角度探索数据价值的实现,即只用区块链作为结算账本,把数据放在本地,在完成本地计算后将结果放在区块链上。此时本地计算需要可信计算作为一个媒介,同时需要考虑预言机问题,这部分可以参考现有的可信计算项目的解决方案。
详解“区块链系统”与“分布式存储系统”
为了更清楚地理解提供分布式存储的区块链系统,我们先剖析一下区块链系统和分布式存储系统。
区块链是通过分布式节点的存储资源,对全网全节点进行存储同步,并通过相应的共识技术保证内部节点对存储内容更改的有效性,维护一个完整的可查找的数据库。在此系统中,存储的都是链内生成账户之间余额的更改或者总剩余,当然,更完善的一些系统功能也包括存储了多个账户对数据库中子账目的数据状态维护。
因此,该系统的主要功能是记录状态的改变,然后同步。对节点来说,无论是PoW、PoS还是PoX,其核心的要求就是遵循特定的投票规则,将新的变动同步在所有节点的存储中。
如果一个系统使用的是区块链结构,那么它是不支持用户个人数据,或者说不支持我们希望实现价值的数据的,区块链上的数据是账户数据以及结算数据,这些数据是完全相同地存储到每一个节点中的。
那么什么又是分布式存储系统呢?
分布式存储系统是分享分布式节点的存储资源,通过文件完整性证明和纠删码校验技术对数据存储方的数据进行分布式管理,全网的节点并不维护相同的存储信息得以降低冗余的一种分布式系统(区块链系统中全网的节点维护相同的存储信息)。
分布式存储是现阶段实现大量数据存储***的一种方法,无论区块链存不存在,分布式存储系统已经是一个相对比较完善、并且已经广泛应用在实际生活中的系统了。