数据存储趋势:文件型数据超过模块化数据
要解决存储问题,首先就要了解我们需要存储的数据对象。就目前而言,企业需要存储的数据主要分为两个部分:
一是基于数据块的结构化数据,例如各种ERP、CRM等企业关键应用型、交易密集型应用所产生的数据(主要是以Oracle、Mysql为基础的数据库型数据)。
二是基于文件型的非结构化数据,例如Web服务器、电子邮件、电子记录和数字媒体等。
此前,企业需要解决也是***解决的是基于数据块的结构化数据,因为,这些数据涉及到企业的关键应用。不过,随着企业应用的发展,基于文件型的非结构化数据的存储需求也越来越大了。
据IDC数据统计显示:在过去三年中,企业部署的应用类型发生了很大的变化。基于更以文件为中心的存储基础架构而运行的一组新型应用(例如Web服务器、电子邮件、电子记录和数字媒体)在公司的企业数据中正占据越来越高的比例。
对此,F5全球营销副总裁Kirby Wadsworth先生表示:“2008年对于数据存储来说是非常重要的就是:基于文件型的非结构化数据开始超过了基于数据块的结构化数据,这就是未来的发展趋势。”
种种迹象表明,相对于基于数据块的结构化数据来说,也是基于文件的数据越来越多,在存储上占越来越大的比例,比如现在我们使用的很多电子设备,无论是手提电脑还是手机,手机上也有摄像头,摄像后存起来就是一个文档式的文件,其他的信息也将以文件的格式出现,这些内容的包括时间、作者等原数据都需要保存下来以便能够帮助我们进行信息的决策。
企业到底面临什么样的数据存储困境?
我们可以从一个具体的例子可以看出,在国内一家移动通讯公司的通信业务里,每打一个电话会有四个文件的存储,这样一个月会出现200亿个新的文件。另外,中国政府的规定是所有的文件必须保存三年,如果这些数据都被存储在一级存储中太贵了,企业负担不起,而最终导致的结果可能是谁都不能再打电话了。
这家通讯企业采取了这样一种应用策略:将文件三个月之后会被自动的存储到二级文件存储磁带里,实现一级存储与二级存储的组合应用。
由此例可见:对于目前很多企业来说,基于文件型的非结构化数据的存储需求越来越大,可能,还到了必不可少的地步。然而,在目前非开放化的专业数据存储系统依然成本昂贵的今天,数据存储的成本直线上升。我们需要对传统的存储方案进行变革。
数据中心虚拟化已经成为一种趋势,对于大量的企业用户,希望以后有多种存储类型。Kirby Wadswort解释到:“因为当前主要的存储方式非常昂贵,耗电量大,客户希望用多种存储方式一个是降低成本,一个是降低耗电,而且还可以提高灾难恢复的能力。”