在今天的文章中,我们将从六个角度来探讨为什么企业、甚至是初创企业正着手运用超级计算资源,而IT组织又能够怎样通过这一强大助力满足大数据与业务分析需求。
制造商、物流公司、制药企业以及能源巨头之间拥有着一大共同点:他们都在利用超级计算设备突破研发领域的限制,并借此回答那些难于甚至根本不可能通过实践方式获得答案的问题。
各类组织目前正利用云服务与PC设备处理着过去需要借助超级计算机之力方能解决的任务。时至今日,云计算的快速发展已经让相当一部分高性能计算工作转而以云环境作为实现平台,而此类产品、服务以及解决方案的供应商们则进一步将目标指向了过去一直高度依赖于超级计算机的研究与科学领域。不过随着云解决方案与超级计算机的不断演进,这两类机制的使用态势并不一定会相互排斥。目前已经有一些企业开始同大学乃至***实验室合作,旨在访问强大的处理资源——其中一部分企业甚至拥有了自己的超级计算机。
我们发现目前有很多企业在这方面有所行动,开始在我们这里以并行方式处理高达上千万亿次的计算负载,”橡树岭国家实验室计算与计算科学副主任Jeff Nichols在采访当中指出。当下来自汽车行业、航空业、能源领域以及科学领域的诸多企业都希望与我们开展合作,从而解决其面临的大规模科学问题。 橡树岭国家实验室以及计算科学合作署——后者为橡树岭与田纳西大学联合建立的联合研究机构——各自拥有一批***且具备领先水平的计算资源及多种架构选项,能够支持他们解决各种各样规模化计算任务。泰坦”是橡树岭实验室目前最为庞大同时也是全球范围内性能排名第二的超级计算机。这是一台克雷XK7设备,拥有2.7亿亿次每秒运算能力,其采用29万9008颗16核心AMD皓龙CPU、18688块英伟达Tesla K20 GPU加速装置外加710 TB整体系统内存。
除了拥有极为强大的硬件基础,计算科学合作署还针对软件包及专有软件进行了优化,因此能够更为高效地在超级计算机或者云环境下实现运行。再有,计算科学合作署还拥有二十位拥有物理、化学、计算科学以及其它领域博士学位,同时精通机器语言的技术人员。他们能够帮助机构用户了解哪些任务能够以计算方式实现。而且正因为他们的科学家身份,其也有助于帮助各企业拥有享受到***的技术成果。
当大家开始使用计算机制时,首先需要明确问题本身并获取更多计算资源。在这方面,不熟悉状况的新人马上就会碰壁,”计算科学合作署主任兼田纳西大学理论与计算天体物理与天文学教授Tony Mezzacappa在接受采访时强调称。具备相关知识的用户了解自己要如何将规模化计算任务分发到设备上的全部节点当中,但他们最终还是会遇到其它难题。举例来说,为了能够在合理的时间周期内完成任务处理,他们可能需要更多内存或者使用更多计算资源。 下面我们就一起来看企业甚至是初创公司采用超级计算资源的六大出发点,包括IT组织为什么有理由考虑利用超级计算设备满足其大数据与业务分析需求。
#p#
数据集在内存中将如鱼得水
如果一套数据集在体积方面太过庞大,又或者大家希望将多套大型数据集加以结合,那么这些数据往往将无法被塞进内存当中。解决这一难题的方式之一是将其拆分成多个小型片段,再对各个片段进行独立分析。虽然对这些数据碎片进行分析的具体途径多种多样,但也有很多分析措施只能在全部相关数据皆驻留在内存中时方可实现——除此之外,这样也能显著缩短整个分析过程。再有,当全部数据皆处于内存中时,我们往往能够提出更多类型的问题、扩展发现范围并找到更深层次的关联性。
如果我想获得关于某个问题的正确答案,我会将全部所需数据引入进来,并加以全面查询,这样才能***程度提升结论的可靠性,”计算科学合作署主任Tony Mezzacappa在一次采访中解释道。
一大典型实例就是识别欺诈性医疗索赔,因为这类状况往往涉及大量数据。通过将所有数据导入内存当中,我们可能会发现某些情况孤立存在于某一案例中,这意味着其存在着属于欺诈的潜在可能性,田纳西大学研究与经济发展办公室商业分析主任Ken Gilbert在一次采访中表示。
计算能力极为强大
目前一部分走在全球前沿的企业正在利用超级计算机扩展自身的计算能力。而且即使已经拥有自己的超级计算设备,部分企业仍然会偶尔与高校或者***实验室合作,因为他们希望拥有更加强大的计算能力或者资源集合,从而更加有效且高效地解决特定问题。
实验与产品开发工作广泛存在而且需要投入大量时间,”计算科学合作署主任Tony Mezzacappa表示。在制药行业当中,超级计算方案在加快药品开发速度与降低药物开发成本方面扮演着重要角色。 飞机制造商则利用超级计算机来处理大量流体力学方面的计算问题。企业与市政机构利用超级计算机提高交通流量执行效率,而数据则由部署在街道上的传感器所生成。企业能够利用这些数据优化车辆的先进路线与交付时间,同时借此降低燃料成本与碳排放量。市政机构则利用这些数据改善交通条件、改善灾害抵御能力并更加高效地执行人员疏散策略。
#p#
互连机制可谓至关重要
与过去相比,企业如今能够更加有效地利用自有资源以及云服务处理规模庞大的数据集合。不过考虑到各节点之间的互连速度因素,超级计算方案的实际效果往往更为出色。
不同的互连机制会对实际执行时间造成巨大影响,”计算科学合作署主任Tony Mezzacappa表示。大家可能拥有一套庞大的集群,但有时候这套集群不一定能够有效执行规模庞大的计算任务。事实上,互连机制将成为左右并行计算设备实际效率的关键因素。 橡树岭实验室计算与计算科学实验室副主任Jeff Nichols认为,从云服务与超级计算机之间作出选择时,大家需要首先明确数据、数据移动情况(也就是数据在处理器与存储体系之间的往来状况)、计算资源需求量以及所需节点数量等信息。
如果大家能够在云环境下解决相关问题,那么云方案当然是***,”Nichols表示。不过很多因素也制约着大家利用云服务来处理工作负载,包括计算内容的隐私属性或者对导出控制能力的担忧等。但只要排除了这些问题,云服务确实成本低廉而且往往也是最理想的备选资源供应方式。
先进的建模能力
从糖果加工到轮胎制造行业,众多企业都在使用超级计算机,而计算科学合作署的科学家们则帮助这些用户进一步调整其建模能力。对于轮胎厂商而言,这意味着在各个阶段的生产环节以及组件制造环节中,包括利用橡胶、聚合物以及其它原材料制作组件,引入建模机制。整个流程拥有非常复杂的层次结构,与企业的经营决策、轮胎产品生产、所制造轮胎的设计开发、轮胎安全性与可靠性以及具体销售方式都紧密相关。不确定因素在流程当中绝不允许存在,因为轮胎的安全性与可靠性直接决定着用户的生命财产安全。
数据类型多种多样,具体包括模拟数据以及根据这些数据汇总出的部分实验性信息得到的分析结果,”计算科学合作署主任Tony Mezzacappa指出。大家需要将实验性数据作为输入信息导入模型当中,而后这些模型将根据轮胎的实验性数据及模型生成进一步输出结果,告诉我们其将在特定情况下出现怎样的变化。如此一来,大家就能够围绕模拟数据为核心、利用实验性信息发现所有可能存在的意外状况,并以故意改变输入及输出结果的方式对不确定性因素加以量化,从而确定该如何更准确地进行模拟并由此引发的影响。最终的轮胎设计方案到底够不够安全?超级计算机会告诉我们答案。
#p#
扩展可能性的疆域
对于那些不熟悉当前超级计算机甚至是云服务能力的企业而言,他们可能根本无法理解计算能够带来怎样令人惊叹的成果。由于解决问题的能力受到严重局限,他们不可能意识到如今的计算资源已经强大到如何超乎想象的程度,自然也就没办法找到问题的***解决办法。
有时候,新手们可能不知道该从哪里入手或者首先提出什么样的问题,所以我们会设计一套理解点,引导他们掌握自己要做什么、告诉用户我们在做些什么、我们能够提供哪些资源并具体解决哪些问题,包括那些能够提出并得到解决的特定问题,”计算科学合作署主任Tony Mezzacappa表示。当他们了解到可能性的具体范畴之后,眼界也会随之开阔,因为时候他们原本认为不可能的任务事实上非常可能甚至毫无难度。 当某项难题超过了现有系统的计算能力时,企业用户可以转而向云服务供应商或者计算科学合作署这样的机构寻求帮助,具体取决于他们的实际需求。那些熟稔计算科学的企业用户往往会向计算科学合作署求助以获取更多资源——包括计算资源、内存或者二者皆有——或者能够跨越多种不同系统以串连方式执行的资源集合(例如共享内存计算机或者分布式内存计算机)来执行相应工作流。
加快发现的脚步
规模庞大且历史悠久的企业往往已经拥有数十年的超级计算机使用经历,但一部分初创公司也同样有着借助超级计算资源解决问题的愿望。举例来说,Atomwise这家决心改变药品发现及开发方式的初创企业就利用IBM的超级计算机对七千种药品进行检测,希望从中找到治疗埃博拉病毒的有效办法。在经过四个月的虚拟探索之后,他们成功发现了两种有效性证据。目前计算科学合作署与橡树岭国家实验室已经拥有大量初创企业用户。
原文标题:Supercomputers Unleash Big Data's Power