大数据与云计算的确有着千丝万缕的关系,不过从技术层面考虑,不应将二者混为一谈。
最近一段时间,大数据成为热议的话题。大数据通常依托Hadoop构架,并与公共云相联系。相关的云服务和云产品不断推出,并且都保证能帮你解决数据问题。事实上它们都在推行着同一个理念:利用公共云的高灵活性以及“几乎无限的可扩展性”,将数据移植到拍字节的大型数据库。
但现实情况和媒体的渲染相去甚远。企业希望将商业数据移植到公共云中的大型数据库中,但同时往往忽略了一些技术问题。
首先,大数据意味着大型整合的挑战。因此,事实上,企业将数据移植到公共云的过程并不简单。当然,每天在网络上传输几百甚至几千份数据记录对你而言是家常便饭,但不要忘记,许多情况下,我们谈论的数据记录是以百万计的,你需要对它们逐一进行转换、传输以及同步处理。
很快你就会为带宽的问题头疼。事实上,美国的许多企业是利用联邦快递将存储数据的USB硬盘送到云服务商那里的。
其次,安全问题在云计算中至关重要,而在企业本地的数据架构或在私有云中,安全支出要比公共云中低很多。在许多情况下,安全模型和安全技术的费用会便宜很多。举例来说,在公共云中,你必须对所有数据预先加密——而在本地数据库在则不必这样做。
你可能对我的观点有所质疑,我想声明一下,我并不是说大数据与公共云永远不能相容,但对于所有技术层面的问题,你必须仔细考虑。而对于架构方面的问题,则需要根据具体情况逐一分析。