【51CTO独家特稿】作为业内为数不多的列存储数据库,Gbase 8a在数据分析,计算方面拥有天生的优势。我们看一下业内知名的Sybase IQ,它在数据处理方面的优势正是列存储数据库的体现。51CTO之前还曾报道过《NoSQL那些事:51CTO带您走进列数据库》,也是对列存储的一番讨论。
对于国产数据库,很多IT人员还是抱着旧有的观念,认为只是抄袭MySQL源代码的“舶来品”。不管技术细节如何,中国还是需要自己的基础软件,哪怕起步还如何喘弱,我们还是要支持自己的国产软件。
51CTO记者与南大通用CTO武新先生(右为武新先生,51CTO摄)
针对数据分析领域,我们看到业内还是有很多不错的工具的,比如微软的SharePoint 2010+SQL Server 2008 R2的组合,不过究竟Gbase拥有哪些优势?我们还是有些疑虑。武新先生告诉51CTO记者,Gbase 8a这样的列存储数据库在存储上具备优势。原本需要1.5TB才能存储的数据,在Gbase 8a可能只需要十分之一的空间。另外由于列数据库无需像行数据库那样每次都要遍历所有的行,因此在I/O执行时间上有一定的优势。当然这种优势是在数据分析方面的优势,在事务处理模式下,还是传统的行数据库占优。
列数据库比行数据库好在哪儿?
提到通用数据库,我们一般都想到的都是五大数据库:Oracle、MySQL、SQL Server、DB 2和Sybase。但是分析数据库这个名词,想必很多技术人员还不是很了解,认为这是我们中国人自己创造出来的一个新名词。其实分析数据库代表着数据分析的意思,主要是帮助大型企业,金融企业和政府对数据进行分析处理。比如51CTO记者在发布会上就听到身后Gbase用户的讨论,两位数据中心负责人来自四川成都医疗方面,主要负责的是当地疾病控制中心的数据上传与分析。在日常工作中需要经常用到数据分析与预测,普通的行存储数据库还是存在系统消耗过大,无法快速响应的问题。可以说Gbase在一定程度上还是有其独到之处的,尽管很多IT人还是对国产数据库的“原创性”存在怀疑。
此次发布会上武新先生还给大家展示了9台PC服务器组成的一个Gbase数据库集群。在20TB到100TB的数据范围内,处理时间上几乎不存在差异。武新先生还为记者具体描述了该PC服务器的配置,就是Intel四核服务器CPU,16GB内存和大容量硬盘,总体价格在三万左右。对于一个数据量在10TB左右的中型企业来说,几万到三十万左右的采购成本还是可以接受的。
NoSQL一直是大家关注的问题,51CTO也就列数据库是否属于NoSQL向武新先生提出了疑问。武先生首先肯定的说,列数据库肯定是要属于传统关系型数据库的,毕竟在列数据库中还存在着大量的关系,从执行上还是沿用关系数据库的思想。谈到NoSQL,武新先生还是认为NoSQL更多的是运用在互联网行业,在传统生产型行业NoSQL的用武之地不大。NoSQL与关系型数据库应该是一种并行互相促进的关系,两者还是多互相融合的比较好。
51CTO最近新推出了一个数据库“也”低碳的话题,主要的理念是通过数据库优化工作,来减少数据中心CPU的I/O执行时间,达到减少电能使用,减少二氧化碳排放的目的。武新先生在演讲中也提到目前采用一定的数据库技术,可以为中国减少半个核电站的能耗。比如Gbase数据库可以节省90%的存储空间,以目前中国300万台服务器的规模,其中三分之一用来运行数据库。每台服务器大约能耗在500W左右,而每台服务器每消耗1W电能就要有2W到3W的电能在散热上。根据以上的数据,得出节约半个核电站的结论就不足为奇了。
数据库产品是否国产化,最大的问题就是安全问题。掌控着中国数以亿计的个人用户资料的大银行和电信行业,都是采用外国数据库产品,假使这些数据外泄,可能对中国人的个人隐私有极大的伤害。就像倪光南院士写的那封信里说的一样“中国需要有自己的基础软件”。希望今后中国能有更多自己的软件,保护自己的信息安全。
延伸阅读
武新,天津南大通用数据技术有限公司CTO(首席科学家),1991年获得法国波尔多大学计算机硕士双学位。曾任职法国Oracle近12年,参与过Oracle数据库的核心技术研发,同时直接设计开发过法国许多大型数据库应用平台,包括家乐福、雷诺汽车、空客飞机公司、法国航空公司、法国电信、法国电力、法国国家银行、法国里昂银行、法国AXA保险公司和法国经济部等等。
【编辑推荐】