【51CTO.com快译】DriveScale是硅谷的一家数据中心技术初创公司,创始人是Sun和思科的一群老兵,他们在幕后开发了这两家传奇公司的核心数据中心产品系列,比如Sun的x86服务器和思科的Nexus交换机及统一计算系统(Cisco UCS)。这家公司已研制了一款向外扩展的IT解决方案,专门面向大数据应用。这家公司最近一举成名,宣布在一轮融资活动中筹资1500万美元。它在应对数据中心不断增长的需求,这个创业团队的技术能力毋容置疑,但是其目前产品只是第一代,想在市场上得到验证仍有很长一段路要走。
先不妨探讨为何面向大数据的向外扩展型解决方案很重要。构建能够支持某种软件定义平台的虚拟控制器不是什么新鲜事。在存储行业,我们之前就在Atlantis USX和VMware vSAN上见过这种产品;在网络行业,则有思科ACI、Big Swtich和VMware NSX。然而,这些技术绝大多数是为传统工作负载设计的,比如虚拟桌面基础架构、数据库、应用程序虚拟化和门户网站等等。
如今,管理IT领域发展速度最快的其中一个方面怎么样?控制业务价值的一个重要来源怎么样?为大数据管理创建一个虚拟控制器怎么样?
据Gartner最近的一项调查显示,2015年,大数据方面的投入继续增加。四分之三以上的公司在投入于或计划在今后两年投入于大数据技术。
Gartner的研究主任尼克·霍德克(Nick Heudecker)在声明中说:“今年大数据本身开始已不再是个话题,而是成为标准实践。由于大数据解决方案成为主流,之前定义大数据的话题变得耳熟能详,比如海量数据量、不同的数据源和新技术。比如说,在已投入于大数据技术的公司当中,70%在分析或计划分析位置数据,64%在分析或计划分析自由格式的文本。”
据Gartner称,企业组织对于大数据项目通常有多个目标,比如改善客户体验、简化现有流程,实现更有针对性的营销,并降低成本。与往年一样,企业组织普遍将改善客户体验视为大数据项目的首要目标(64%)。流程效率和更有针对性的营销如今持平,同为47%。由于数据泄露事件不断成为头条新闻,改善安全功能的增幅最大,从15%提高到23%。
Gartner的另一位研究主任丽萨·卡特(Lisa Kart)在声明中说:“随着大数据成为新的常态,信息和分析领导人将重点由辨别炒作变成寻找价值。虽然理解价值的长期挑战依然存在,但是技能、管理、资金和投资回报率这些实际挑战走到了前台。”
下面是Gartner关于大数据的另一些重要预测:
·到2020年,信息将用于重新发明、数字化或消除十年前80%的业务流程和产品。
·在2016年,只有不到10%的自助式商业智能项目将得到充分管理,防止给业务带来负面影响的不一致问题。
·到2017年,50%的信息治理项目将整合信息倡导(information advocacy)这个概念,确保它们是价值驱动的。
那么,DriveScale旨在在哪里大有作为呢?
向外扩展的机架数据中心架构
DriveScale的问世归因于这三大趋势:
1. 软件向外扩展型堆栈的兴起和大数据方面的需求。如今显然需要让大数据工作负载大大提高弹性、可用性和效率。最重要的是,这些工作负载需要能够动态扩展。此外,还需要智能化工作负载管理,易出故障的硬件确保数据集安全、可用。最终,DriveScale旨在搭建一种更有弹性的生态系统,为数据提供更好的配置功能。
2. 商用技术和白盒技术。你的数据中心里面已经有网络、存储和计算系统。如果你完全可以针对大数据项目更有效地管理它们,何必要更换?一些企业组织期望部署更好的大数据管理生态系统,它们面临的一大挑战是,它们在使用传统手段来管理庞大数据集。DriveScale推出了一种虚拟控制器,定位于软件定义管理层,可以为大数据项目统一关键资源。
3. 网络层不断发展。1GbE连接是很久以前的技术了。我们看到更多的连接功能,网络层智能大大提高。DriveScale的技术旨在抓住这种大好形势,大大加快交付大数据工作负载的速度。深入了解机架里面的连接和拓扑结构让DriveScale得以获得驱动器、它们处理的数据以及信息优先级等方面的更多信息。比如说,他们可以看到哪些驱动器与服务器间隔的跳数(hop)比较少,基本上创建与数据管理和资源分配有关的“机架内以太网”。
DriveScale的首席科学家兼联合创始人汤姆·莱昂(Tom Lyon)说:“我们的看法是,10GbE及之后的网络技术变得更便宜、更普及了。所以,数量更多的带宽和网络控制器让新型架构得以问世。”
在过去,莱昂在Nuova Systems担任过重要的技术岗位,2008年这家初创公司被思科收购,其技术后来成为思科的UCS服务器和Nexus交换机的基础。
DriveScale并非一开始想解决全球的软件定义基础设施和融合问题。相反,它的战略专注于克服两大挑战:
·难以管理庞大数据集和大数据环境。企业组织被迫管理孤立的大数据运营,常常使用传统的计算、存储和网络机制。DriveScale不仅力求克服这些挑战,还特别专注于向外扩展的应用程序市场。Hadoop、MapR、Cloudera及其他厂商的平台可以与REST API架构集成起来。
·服务器管理员在管理Hadoop和向外扩展的环境面临大麻烦。公司面临的压力是从它们处理的数据获得价值。原因何在?这些数据变得对整个业务流程而言越来越有价值。不是部署磁盘“被束缚”的传统服务器,DriveScale改变了管理员控制为大数据工作负载配置的资源的方式。使用软件,你可以为一组大数据应用提供磁盘集群(和服务器)。而且,这些资源与来自常规机架式服务器的可用资源区分不开来。基本上,你不再受制于服务器机箱,实际上可以向外扩展。莱昂称之为“软件定义的金属薄片”。
为了克服这些挑战,DriveScale不得不构建一种新型的管理架构。DriveScale的产品管理主管蒂娜·诺尔特(Tina Nolte)说:“我们发明了一种机架规模的架构,可最大限度地利用网络、计算和存储环境。这是一种新型的逻辑层,让你可以构建软件定义节点,进而管理复杂的、不断扩展的大数据环境。”
大体上来看,这种架构相当简单:
·存储、网络和计算完全取决于你。有青睐的厂商?很好,DriveScale可能会与他们合作,没有问题。
·你的网络层充当连接器。你使用现有的网络部件,能够实现资源之间的联系。之后,你可以管理节点中链路之间的负载,打造集群级管理,那样你可以造反并构建自己的细粒度规则,并创建基于权限和应用层策略的访问控制机制。
·神奇之处体现在软件。DriveScale软件让你可以构建上述的软件定义大数据节点。此外,它让你可以细粒度地重新平衡计算与存储比。基本上,随着你的大数据环境因新的业务要求而不断发展扩大,它可以动态调整。
那么,DriveScale和其他基于软件的超融合基础设施解决方案之间有什么区别?超融合系统使用向外扩展的架构和虚拟控制器,专注于传统工作负载。DriveScale专注于向外扩展的工作负载(比如大数据),使用商用硬件,并借助向外扩展的软件。
结束语
再说一下,DriveScale的产品和业务仍处于早期阶段。这家公司仍在努力达成战略合作伙伴关系,构建经过验证的参考架构。构建这些参考架构,并与惠普企业、思科、戴尔、Super Micro及其他公司结为联盟,对于促进进一步采用、得到更广泛的认可大有帮助。此外,要是有什么问题,这还有助于支持。许多企业组织喜欢战略性合作伙伴关系,这让它们得以只需要为单一支持渠道操心。
支持DriveScale的技术旨在解决业界一个日益严重的问题。向外扩展的应用市场在非常迅速地发展,企业组织在这方面需要帮助。大数据在不断地越来越大,并且在改变商业智能塑造现代企业组织的方式。眼下,DriveScale这家公司正在采取一种特定的“软件定义”解决方案,着眼于向外扩展的应用行业。然而从趋势来看,它不可能寂寞太久。
原文标题:DriveScale Says Big Data Needs a New Kind of Data Center Infrastructure,作者:BILL KLEYMAN
【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】