关于数据库和区块链,总会有很多的困惑。区块链其实是一种数据库,因为他是数字账本,并且在区块的数据结构上存储信息。数据库中存储信息的结构被称为表格。但是,区块链是数据库,数据库可不是区块链。他们虽然都是存储信息的,但是设计却完全不同,所以不可以互换。而且,这两者存在的目标也不同,所以对于很多人来说,他们不是很清楚为什么区块链是需要的,以及为什么数据库更适合存储某些数据。首先,我们来看看数据库和区块链之间的区别。
数据库
传统数据库是用来存储信息的数据结构。这包含能够用来制作支持各类商业,金融和管理决定的报告,所需要的数据。政府也会使用数据库来存储大型数据,可以会有几百万个记录。数据库从文件分级系统开始,提供了最基本的信息获取和存储功能。然后,数据库使用相关的模型,通过将多个数据库进行相关,可以有更多复杂的方式来获得数据。存储在数据库中的信息可以使用管理系统来进行管理。简单的数据库被存储在数据行列中,被称为表格。表格中包含不同领域,用来定义不同记录的种类,存储数据被称为属性。每个领域包含列和航,代表存储的记录。
数据库是被管理员可以修改,管理和控制的。数据库总是会有管理员,并且可以完全控制数据库。他们可以创建,删除,修改数据库中的任何记录。他们能优化数据库的性能和大小。越大的数据库就会有更慢的性能,所以管理员可以使用方法来优化。管理员也可以把这个身份转给别人。例如,管理员可以把身份转给另外的用户,让他们来进行数据库备份。但是,问题也会有,例如服务器跨了,唯一的方法就是从备份恢复。数据库也是递归的,也就是说你可以回去重复某个任务,或者说删除任务。如果信息已经备份,那么管理员就会删除之前的记录和其他过期信息。比如你在现在数据库写入了“John Smith”,现在需要更新住址。但是现在已经有“John Smith”的备份了,所以你可以通过现有数据库的新地址进行更新。
数据库可以通过服务器架构来实现。这是因为计算机需要连接服务器,它们管理数据库,从而可以获得信息和存储的数据。最初地时候,数据库客户端使用ODBC连接,这是由管理员设定的,然后连接到数据库。这个客户端软件然后就会运行,来完成加密连接,但是必须要有权限才能进入。这个权限能够被管理员设置,或者用户通过密码也可以进入。这就是为什么用户账号会被创造,可以让认证的用户进入,同时拒绝那些没有认证的。现在大多数系统,都会使用网页接口。但是对于私人信息,还是需要认证,但是公开数据库就可以很容易地通过网页进入。
我们可以看出,数据库需要足够的控制,这会让它高度中心化。同时,这也是需要允许的,也就是说需要管理员来设定如何让用户进入。在生产环境下,DB管理员需要设定只读权限,他们也需要给用户设定更新和写入的权限。传统数据库的中心化会保证系统的安全和信任。很多数据库都会在私人网络下运行,同时背后是大公司的防火墙。其他也有数据库是基于云服务器。但是他们仍然是需要管理员来控制他们。
区块链
对于区块链的描述,我们会想到比特币。但是也有很多在企业环境下运行的私有链。区块链在2009年诞生,比特币是基于它的第一个系统。在比特币系统中,区块链是不可更改的数字账本,并且也是逐渐增长的加密分布式数据库。区块链会在同等大小的区块中存储信息。每个区块都会包含前个区块的哈希信息,从而提供加密安全性。这个哈希的信息就是前个区块中的数据和签名,并且前个区块的哈希会回到区块链的首个区块,被称为“创世区块”。整个信息就会通过哈希通过,并且指向下个区块的地址。区块链数据结构,例如默克尔树,是很有效地数据验证方式。
为了让区块能够加入到区块链上,整个过程中包含了博弈论。网络中作为节点的计算机被称为“矿工”,必须要竞争来从nonce中找出正确的数值。矿工必须要用计算资源来解决这个数值,而且这也需要计算机硬件。区块链内置的协议,可以通过全网算力来得出解决难题的难易程度。这意味着如果有越多的矿工,解决问题的难度也就越高。这是因为如果有更多矿工,网络上就会有更多的计算资源,同时提高了哈希力,也就是h/s。一旦矿工验证了区块,他们会因为提供算力而获得奖励。这部分激励就是推动节点来挖矿的动力,因为他们会获得交易费用和代币。在比特币中,这也被称为工作量证明算法。
就像我们看到的,区块链使用去中心化的分布式网络。去中心化意味着网络所有的节点都会存储区块链的备份。节点存储全节点的备份,或者是挖矿,或者他们两者都可以做到。没有任何的管理员来验证区块转账。你需要能够解决加密问题的矿工,但是这是基于全网算力的比例。一旦区块被加入到链上,那么这些信息就是不可改变以及透明的。区块链转账是不可以逆转的,这也意味着一旦验证了区块,他们就不能重复使用。区块链是可以容错的,因为如果一个或者多个节点宕机,总是会有其他节点在运行区块链。去中心化的另个优势,就可以让那些不认识或者不信任的人获得透明性。区块链会通过记录转账来提高信任,并且提供加密安全算法来交易数据。
区块链是P2P的网络架构。它并不需要中心化的数据库,而是网络所有的节点都会互相连接起来。所以,没人可以控制所有的节点。区块链上无需管理员。如果节点中有人欺诈呢?这会影响整个网络吗?理论上的答案是如果他们获得大多数算力,那么就是可能的。理论上,如果有人可以控制51%的算力,就可以控制网络。这需要非常多的计算资源,所以产生攻击是非常昂贵的。使用计算资源挖矿是有利可图的。能够保证区块链安全的本质就是去中心化,如果有人想修改区块链上的任何信息,就需要其他人的帮助来验证。这就会从主链中分割出新的链,并且只有比主链长才会有效。类似比特币有几千个节点,所以如果需要进行欺诈,就需要改变网络中的所有节点。实际上,这是需要大量计算和电力的,也非常困难完成。这是一种监管的方式,为了保证没人可以欺骗任何人。这就是为何区块链是不可更改的。同时,由于转账信息任何人都能看到,因此这也是透明的。
这就是区块链和数据库,在底层架构上的区别。
区块链和数据库,何时应该用哪个?
数据库由于很好的稳定性,对于企业网络来说,是比较适合的。他们对于用户来说,也更加友好,并且对于管理员和开发人员,也有很多支持性的管理系统。福布斯前500的企业都会使用数据库来运行高端系统,从而处理大量的数据。数据库可以扩容到几百万记录,而且可以每秒处理几千个转账。对于处理大量流量,例如零售,数据库是最好的解决方案。区块链不需要存储大量的处理来进行分析,数据库可以存储更多的数据,并且由于不需要节点,处理速度也更快。你也不需要对于每个数据进行加密。通常,数据库是不加密的,因为加密会让数据库增加很多冗余。传统数据库会通过授权来提高加密性。
非结构性数据是不需要区块链的另个地方,这些更适合数据库管理系统。数据不需要信任验证,就好像商店每天的数据都会记录在数据库中。如果使用区块链,来存储私密信息,就会成本很高。只有某些公司才能知道的信息,例如社交安全和病历都是存储在数据库中。能够通过公开验证系统使用的信息,都可以基于区块链。这些个人信息能够基于公钥加密算法,来在区块链上认证。
数据库适合用于:
- 需要不停更新的数据,例如监控和传感器
- 快速在线转账过程
- 私密信息(不能对公众开放的)
- 需要快速处理的金融数据
- 不需要验证的数据
- 存储数据的应用
- 关系数据
区块链的需求是建立信任和透明。简单来说,它就是可以让任何人获得信息的公开账本。它可以帮助B2B转账,例如供应链,货品分布以及库存去验证信息。透明性可以帮助企业例如广告业,通过建立广告公司的更多验证,从而最小化欺诈行为。区块链,不是说大型数据记录就会有更多的信息验证。比特币是区块链首个成功部署,而且它也是作为价值转移和支付转账验证的系统。比特币的成功也提出了双花问题,可以让用户针对同个代币花销两次。比特币使用了能够使用时间戳顺序的来对转账进行验证。这就同个让系统同时处理转账,从而防止双花,这会是按照时间顺序来完成的。
有些项目正在研究区块链的许可性系统,将他们应用到投票系统中。由于区块链可以验证身份以及谁来投票,其实就会很有意义。主要的目标是防止欺诈,所以区块链可以保证信任的公平,一些区块链不需要数字货币或者挖矿,例如企业级别的区块链。在私有和可许可环境中,使用区块链科技可以有新级别的系统,有时候也会和数据库整合,完成混合系统。
数据库管理员会发现,区块链是不相关的。你不能在不同的区块链和相关数据创建联系。这就是这两者重大的不同,所以当信息需要相关性的时候,区块链就不适用于这些。
其他区块链的应用,例如以太坊上的智能合约。这些更像是数据库的存储流程,其中触发器可以用来执行代码来处理转账。在以太坊网络中,智能合约会在网络中的所有节点运行代码。以太坊和其他数字货币,例如EOS和NEO会使用区块链作为他们的智能合约生态。这是区块链和传统数据库区分的案例。
区块链适合用于:
- 资金转账
- 价值转移
- 可信数据的验证(身份,信誉,信用等等)
- 公钥验证
- 去中心化APP
- 投票系统
关于区块链和数据库,还有很多可以讨论。我们只是从技术角度,来发现其中的一些情况。其实数据库和区块链,并没有谁比谁好。他们都有自己的目标,以及根据你想要处理数据的方法,来选择不同的方案。