以神威·太湖之光和安腾为例,看通用与专用超级计算机的区别

业界
超级计算机正以空前未有的力量,重新绘制着科研领域的广阔图景,并不断拓宽着技术创新的极限边际,展现出前所未见的变革动能。尤其近日埃隆·马斯克公布其宏大的人工智能超算项目,再次将全球的瞩目焦点引向超算。

超级计算机正以空前未有的力量,重新绘制着科研领域的广阔图景,并不断拓宽着技术创新的极限边际,展现出前所未见的变革动能。尤其近日埃隆·马斯克公布其宏大的人工智能超算项目,再次将全球的瞩目焦点引向超算。今天,我们就借着这股科技热潮,深入探索超级计算机的神秘双面——通用超算与专用超算,揭示它们如何在浩瀚的科技星海中各显神通的。

图片来源:网络

通用超算,顾名思义,确如其名,设计旨在应对广泛多样的科学与工程挑战,强调灵活性与普适性。它们采用标准化组件,以便支持多样化的应用软件和算法需求,应用领域覆盖从气候模型、航天器设计到新材料开发等多个领域的大型计算任务和工程模拟。

专用超算则专为解决特定类型的问题或服务于某个细分领域而定制,通过采用定制的硬件与软件实现对特定计算任务的深度优化。这种设计虽然牺牲了通用性,却能在目标领域内实现无与伦比的计算效能。实际应用案例包括加速药物研发流程、强化人工智能训练,以及提升气象预报的准确性等。

概括来讲,通用超算注重广泛适用性和灵活性,而专用超算则聚焦于特定领域的极致性能。尽管两者侧重点不同,但它们都依赖于强大的数据处理能力和先进的计算技术,比如高密度集成与高效能计算架构,共同追求更高的能效比。

接下来,让我们以通用与专用超算的代表品牌为例,具体来看二者的区别。

通用超算:计算世界的“瑞士军刀”

试想拥有一件工具,既能开启日常的饮料瓶盖,又能承担锯断木材的重任,甚至能精准修理微小的电子产品——这便是通用超算在计算领域中的角色定位。它们作为多面手,凭借卓越的灵活性与广泛的应用性,在众多科技前沿领域能够自如应对,游刃有余。

讲到通用超算,就不得不讲到它的典型代表品牌:来自中国的神威太湖之光。

神威·太湖之光 | 图片来源:网络

神威·太湖之光超级计算机是由中国国家并行计算机工程技术研究中心研制,旨在实现关键核心技术的自主可控,将创新主动权和发展主动权牢牢掌握在自己手中。

神威·太湖之光的核心布局彰显了高度的系统集成与创新设计。该系统由40个功能强大的计算机柜构成,而每个柜体内嵌数百个独立的计算节点,形成了一张错综复杂的计算网络。每个计算节点均配备了两枚国产自主研发的申威SW26010多核处理器,这些处理器协同运作,构筑起一个规模壮观的计算矩阵,为解决复杂问题提供了坚实的基础。

在系统架构上,神威·太湖之光采用了大规模并行处理(MPP)策略,这种设计允许成千上万的处理器同时工作,大幅提升了计算效率。尤为值得一提的是,系统内部集成的SW26010高带宽网络芯片,这是专为实现高效数据交互而设计的自主网络互联架构,确保了计算节点间的数据传输快速流畅,为并行计算的高效实施提供了强有力的保障。

此外,神威·太湖之光运行在基于Linux内核定制的国内操作系统之上,这一操作系统不仅优化了对超算平台的原生支持,还实现了对硬件资源的精细管理和能耗的有效控制。得益于此,平台不仅能够达到令人瞩目的每秒12.5亿亿次浮点运算的峰值性能,同时在能源管理上也表现出色,体现了自主可控与高效节能的双重优势,进一步稳固了其在全球超算领域的领先地位。

2016年7月,发布不久的“神威·太湖之光”即荣获吉尼斯世界纪录认证,被誉为“全球运算速度最快计算机”。随后的2016至2017年间,它连续四次蝉联世界Top 500排行榜超级计算机冠军。

作为通用超算的典范,神威·太湖之光在应用场景上能够解决广泛的科学与工程问题,应用领域覆盖航空航天、地球科学、海洋研究、气象预测、生物医学、工业设计等。

例如,2016年,中国国家流体力学实验室基于神威·太湖之光,对”天宫一号“飞行器两舱简化外形陨落的飞行绕流状态进行大规模并行模拟,在20天内便完成常规需要12个月的计算任务,该计算结果与风洞实验结果吻合较好,为”天宫一号“飞行试验提供了重要数据支持。

在2023年,神威·太湖之光与中国移动联合成立的国产超算并网实验室,上线了首个云市场的超算产品“神工坊”,为企业提供了高计算精度、短设计周期、低实验成本的工业仿真服务,使得更多中小企业能够通过云服务、租用的方式开展科学研究。

此外,神威·太湖之光还在气候模拟、天体物理学等领域取得了重要应用成果,其中有三项通过它开展的应用课题荣获了“戈登贝尔奖”提名,进一步彰显了其在全球超算应用领域的领先地位与深远影响。

专用超算:计算世界的“手术刀”

而专用超级计算机则好比医疗技术里那把锐利无比的激光手术刀,它不追求广泛适用,而是在特定领域内深入精研,以令人惊叹的效率执行“精确打击”。

提到专用超算,就不得不提到超级计算机安腾(Anton)。

安腾超级计算机 | 图片来源: David E Shaw研究所

安腾(Anton)是一款由位于纽约的D. E. Shaw Research设计并制造的大规模并行超级计算机,于2007年发布,自2008年开始运行。这款超级计算机是专门为蛋白质和其他生物大分子的分子动力学(MD)模拟打造的特殊专用系统。

每一次显微镜技术的进步都是为了增强人类对微观世界的观察能力和分辨率。以蛋白质为例,依靠最先进的冷冻电镜,结构生物学家已经可以获得超高清蛋白质分子“照片”,但照片能够看到的信息终究是有限静态的,真正能够决定蛋白质多样功能性质的其实是蛋白质的三维动态运动过程。只不过,从静态到动态的鸿沟已经很难靠物理观测的显微镜技术来取得突破了,科学家只能利用计算机对蛋白质的动态运动进行模拟,最常见的计算机模拟研究方法就是分子动力学(MD)模拟。然而,由于计算效率瓶颈,分子动力学模拟方法始终难以产业化——如果靠普通的计算机,仅仅模拟一个50万原子的蛋白质0.001秒运动就需耗费超过100年的时间,而人体内有超过2万种几十/上百万个原子构成的人源蛋白质。

在这样的背景下,D. E. Shaw Research设计并研发出专门加速分子动力学算法的专用超级计算机——安腾超级计算机,彻底让计算机模拟的分子动力学成为可以应用于研究微观生物体系动态过程的新方法。概括来讲,超算安腾凭借其定制硬件、高效网络结构以及专业软件的紧密结合,能够处理涉及数百万到数千万原子规模的相互作用模拟,显著提升了分子动力学模拟2-4个数量级的计算效率与运算能力。

在硬件构成上,超算安腾由D. E. Shaw研究所特殊设计,采用了深度定制的专用集成电路(ASIC)芯片。这些芯片针对性能进行了特别优化,能够减少数据传输和处理的时间,并通过芯片上的分区和不同精度计算,有效解决了分子模拟中原子间相互作用力计算速度的瓶颈问题。同时,系统内嵌的新一代专用网络,确保了数据通信的低延迟与高吞吐量,以及直接内存访问(DMA)引擎以增强计算与通信的并行处理能力,从而缩短了等待时间。此外,配套使用的Desmond是专门为安腾开发的动力学模拟软件,进一步强化了系统的模拟效能。

与神威·太湖之光这类通用超算不同,安腾超算只专注于分子动力学模拟计算,正是这份专注使得它将计算效率提升到了极致,其在执行分子动力学模拟任务时,至少能比神威·太湖之光快100倍以上,也就是说安腾超算最多3天就可以算完神威·太湖之光满载一年才能处理的分子动力学模拟计算量。凭借其在专用领域高性能计算的出色表现,安腾超级计算机曾两度荣膺高性能计算领域的最高荣誉——“ACM戈登贝尔奖”。

在应用层面,相比全能型的通用超级计算机,安腾超算确实存在一定的应用范围限制,它主要致力于解决计算化学中分子动力学模拟的加速问题。然而“术业有专攻”,正是这种高度的专业聚焦,让安腾超算在自己的专长领域内能够最大化地发挥其技术优势,展现了其在特定应用场景下无可比拟的效能,进一步验证了专业定制技术在推动特定科学领域进步中的关键作用。

在药物研发领域,新药的研发是公认的周期长、成本高和失败率高,一般认为一款新药的诞生至少需要10年的时间投入和10亿美金以上的研发投入才能问市。但是2016年,在安腾算力的支持下,美国AI制药公司Relay Therapeutics横空出世,仅用18个月、不到1亿美金,就确认了一款高选择性FGFR2抑制剂药物RLY-4008的结构,极大程度地缩短了从药物发现到临床前研究近90%的投入时间和成本。而这成绩的背后,就是由于Relay公司的研发人员利用安腾超算对药物靶点和成药小分子的结构进行分子动力学模拟和筛选设计,从而突破了长时间大规模分子动力学模拟的计算瓶颈。

在新冠病毒刚刚爆发后不久的2020年3月,D. E. Shaw研究所免费向世界公布了它们利用安腾超级计算机模拟的新冠病毒3CL蛋白酶动态结构数据,模拟动画时长达到100微秒,为3CL蛋白酶抑制剂的早期研发工作提供了极其宝贵的数据信息。引人注目的是,该长达100微秒的复杂模拟任务,在安腾超算的高效驱动下,仅耗时约两周即告完成,这样快的速度即使是世界前十位最强的超算加起来也难以企及,真正是天下无敌、独孤求败,这正是安腾超算深耕于分子动力学模拟计算所得到的结果。

通用与专用超级计算机,作为计算科学的两个重要分支,分别代表了广泛适用性和专业针对性。在面对日益复杂和多样的科研需求时,理解并恰当运用这两种计算模式——通用超算的广泛适应性和专用超算的深度优化能力,对于科研人员和技术工程师来说至关重要。掌握何时以及如何结合“广泛通用”与“高度专业”的技术手段,是应对未来科技挑战的一项核心能力。


责任编辑:企业资讯
相关推荐

2019-06-18 09:20:38

计算机互联网 技术

2011-11-02 09:48:14

超级计算机中国芯HPC

2016-06-20 16:27:14

超算

2016-11-17 14:34:18

超算

2023-05-26 07:45:55

计算机AI人工智能

2017-11-17 09:35:40

AI计算机视觉

2020-05-19 10:49:10

网络安全恶意软件技术

2010-06-13 13:43:30

Linux超级计算机

2012-08-30 10:22:26

IBMWaston超级计算机商用Siri

2012-11-12 13:46:56

手机超级计算机

2023-03-02 07:49:38

2012-02-29 10:02:59

IBM量子计算机超级计算机

2011-11-17 13:28:35

云计算超级计算机

2013-04-01 10:51:02

2011-12-28 13:30:36

云计算Amazon超级计算机

2010-06-22 13:11:18

超级计算机未来

2011-07-08 09:55:02

数据中心防震

2021-06-16 11:13:49

曙光
点赞
收藏

51CTO技术栈公众号