数据是新的石油。
然而,在一个重要的方面,石油与数据不同:石油的价值与市场供求规律有关,当石油缺乏时,价格就会上涨;与之相反的是,数据每天都变得越来越多,数据越多就越有用,也越值钱。
在过去两年,现有数据的90%都是新生成的。社交媒体、流媒体、物联网——随着我们的联系越来越紧密,我们创造了更多的数据。
与石油不同,管理数据的最大挑战不是维持不断减少的供应。而是如何处理和利用每天生成的2.5万亿字节的新数据。
大数据带来了巨大的挑战
消费者数据具有很高的价值。
新数据创建的庞大规模带来了最重大的挑战,数据量的增加导致了向云计算的转变。云计算允许科技公司通过购买大量存储和处理能力来利用规模经济,使非科技公司找到比维护自己的服务器更划算的方法。
现在,云计算公司正在竞相满足客户的需求。面积超过100万平方英尺的“巨型数据中心”正在变得越来越普遍。这些建筑不仅占用空间,还需要大量的能量来存储和处理大规模的数据。
然而,还有其他挑战。集中式服务器可能成为黑客攻击的目标,因为消费者数据具有很高的价值,供应商必须确保数据始终对客户可用。
外包这些挑战使数据的最终使用更容易,但云计算供应商无法确保他们存储的数据是准确的。这个特殊的问题完全取决于数据所有者。
区块链给大数据带来了什么
区块链有望在2030年控制20%的大数据市场。
区块链技术的几个特性很好地解决了处理大数据的问题。
首先,区块链是去中心化的。使用去中心化的网络来管理数据存储和处理可能会带来无限的伸缩性,因为任何具有计算能力的机器都可以为网络做出贡献。
去中心化还提供了一层抵御外部攻击的保护——去中心化网络需要获得51%或更多的网络哈希能力才能被攻击,这使得它比存储在中央服务器上的数据更不易受到黑客攻击。
区块链还采用一致同意的方法将交易添加到分类账中。将此应用于数据意味着网络可以在验证数据的真实性和来源方面发挥作用,减少不准确的实例。因为区块链是不可变的,所以存储在它上面的数据永远不能被任何人修改或操作。
最后,大数据使用面临的最大威胁之一是政府对公民隐私和数据安全的监管。区块链本身并不能克服这一问题,但是部署密钥加密意味着个人可以更好地控制如何使用他们的数据并将其传递给第三方。
这些特点证明了区块链有望在2030年控制20%的大数据市场的预测是正确的。
将区块链应用于大数据
数据存储和处理是当今大数据面临的两个最基本的挑战。
尽管在这一领域仍有大量的开发工作要做,但一些先行者项目已经在为融合区块链和大数据的用例方面取得了长足的进展。
A.预测分析
Endor开发了一个去中心化平台,利用大数据为其预测分析引擎提供动力——强大的洞察力可以被企业用来帮助它们获得竞争对手没有的优势。
例如,零售商可以预测哪些消费者可能会购买一周前推出的产品,哪些人会转而购买高级产品,或者哪些消费者最适合购买特定的新产品,该算法将提供所请求的消费者列表,预测他们未来的行为。
Endor协议是基于麻省理工学院对一门叫做“社会物理学”的学科的广泛研究而开发的。
“它从大量来源获取大数据,并利用这些数据创建快速准确的预测,而不需要任何数据科学家或研究分析师的参与。”因此,Endor有潜力为目前被大数据市场排挤的小企业提供公平的竞争环境。
B.存储和处理
数据存储和处理是当今大数据面临的两个最基本的挑战。
区块链领域的几家初创公司正致力于利用世界各地家庭和办公室中可用的大量空闲计算资源来解决这些挑战。
例如,Storj提供了一个点对点的文件存储网络。通过使用加密技术和分片,用户可以保证网络上没有任何机器可以访问他们的文件。
Golem提供了一个类似的解决方案,但是用于处理能力。作为一台去中心化的超级计算机,任何人都可以以比使用AWS等供应商更低的成本出租多余的GPU或CPU电源来执行特别计算。
C.去中心化的人工智能
人工智能(AI)算法是数据饥渴型的,需要大量的数据来构建模式和识别算法,为机器的智能提供动力。
SingularityNET旨在为人工智能算法、智能和服务创建一个全球市场。
其原理是通过去中心化的人工智能,所有的学习都在整个去中心化的网络中共享。这意味着每台机器或算法都可能访问网络中可用的所有数据、信息和智能。人工智能机器第一次可以互相学习,而不是从创造者输入的单一数据源中学习。
结论
区块链就是基础设施。
尽管作为“新石油”的数据是一个糟糕的经济类比,但它在说明数据如何推动这些用例和新兴技术方面确实有一些价值。
如果这些新技术是载体,那么区块链就是基础设施。它正在修建道路和铁路,以便在未来很长一段时间内平稳、可伸缩地处理数据。