本文转自雷锋网,如需转载请至雷锋网官网申请授权。
本周在意大利CINCA研究中心揭幕的Leonardo(莱昂纳多)超算是用了14000个Nvidia GPU,Nvidia称其为“世界上最强大的AI系统”,这个系统在某些半精度浮点(FP16)应用中提供10 exaflops的AI性能,在以Top500为基准进行测试时,可以提供大约200 petaflops算力。这一系统的推出,也将从今年底开始改变欧洲超算系统的格局。
对于那些从事超级计算已经有几年时间的人来说,对Bull系统应该十分熟悉,尤其是在欧洲。这家公司在2014年初被Atos收购,但从外界的角度,本质没有变化,直到HPC产品(包括“ Sequana”系列)使用Bull的名称。
多年来,Bull一直是欧洲知名但规模不大的HPC集成商,取得了几项重大成就,在研究和学术界只有相对少数的系统。但时代在改变,特别是在Bull重要的收购之后。
先是将IBM的x86服务器业务出售给联想的交易,由于IBM在高性能计算市场关键的地位。欧洲HPC中心也别无选择,因为联想距离很远。IBM具有足够的本机资源,可以用于许多中心,因此多年来,许多欧洲研究机构、政府机构、气象机构、甚至大企业的HPC都是用IBM的产品。
另一家公司Cray希望在欧洲获得许多胜利,这种趋势一直持续增长,直到最近收购HPE为止,尤其是在天气和大型计算设备领域。尽管我们尚未看到这种供应商转变对市场的影响,但我们预计在欧洲,变化会在未来几年中显现。这不是因为Cray或IBM不合适,也不是因为他们的技术已经改变,是欧洲想要一直想要的东西——自己的HPC供应商生态系统。
作为独立公司,Bull不可能像今天在意大利的CINECA那样,我们稍后将讨论。但有了这个系统的支持,以及其他许多将在明年进入超算Top 500的系统,Atos至少在欧洲是绝对值得关注的HPC系统。
就超级计算机Top 500排名中的系统份额而言,即使被收购,Bull / Atos也没有显示出太大的增长。有人可能会认为,较大的母公司可以帮助Bull获得一笔交易,但事实并非如此。从2012年到2014年,Bull保持3.6%的系统份额,2016年跃升至4%,在2018年又小幅提升至4.4%。
根据今年的最新数据,他们上升到5.2%,榜单上共有26台超算,其中最大的是排名20名的法国CEA的系统。补充说明一下,如果没有CEA,作为超级计算公司的Bull可能不会存在,CEA需要一家法国本土公司来实现其最高价值的国家优先事项。
总体而言,系统份额将有所变化,从即将在11月发布的全球500强榜单开始。
似乎Atos正在建立“ Baby Summit”超级计算机。所谓“高密度”,是指具有类似于美国橡树岭国家实验室的GPU密集的系统。不同之处在于,他们没有使用基于IBM Power的处理器,而是完全避开了Power,仅选择了Intel和AMD(这并不令人感到意外)。但是话又说回来,当涉及即将面世的CINECA之类的系统时,浮点功能几乎完全由Nvidia的Ampere A100 GPU提供。
在欧洲,Atos与配备GPU的超级计算机一起发展。上周,他们宣布将把他们的Bull Sequana XH2000 super引入芬兰的CSC。在此之前,他们宣布了两个大型系统,其中包括瑞典和英国“最大的AI超级计算机”。
除了与瑞典和英国的大型系统,他们还与Nvidia加强了合作关系,以向其他大学提供(可能是定制的)SuperPOD计算机。而且,有迹象表明他们准备在利润丰厚的,至关重要的HPC市场(天气预报)中分食Cray / HPE和IBM的市场。Bull今年还与ECMWF签订了四个系统(总计27 petaflops)和新系统的协议,是气象机构的AI和量子研究中心。
如今,Atos在欧洲处于有史以来最强大的地位,这表明它可以提供与世界范围内的Cray / HPE和IBM相当强大的,用于多学科科学和技术计算的系统。实际上,有人可能会争辩说,今天宣布的“LEONARDO”超级计算机将把Atos带入高性能计算世界的真正“大时代”。
很难说LEONARDO超级计算机进入世界500强时将位列第几,但有望达到200 petaflops的峰值半精度浮点性能(Nvdia称其为前10 EB的AI超级计算机,它基于FP16)。
在与Nvidia的Ian Buck的一次电话会议中,这家GPU制造商表示这将是欧洲最强大的AI超级计算机,将拥有14,000多个A100 GPU,并在Atos Sequana节点上的四个A100 GPU上分解成一个单一的具有英特尔Rapids处理器和Nvidia Mellanox HDR 200Gb / s网络。
LEONARDO由EuroHPC采购,EuroHPC是欧洲各国政府与欧盟之间的联合合作,旨在在欧洲开发世界一流的超级计算生态系统和百亿亿次超级计算,并由欧洲委员会通过意大利大学和研究部资助。
NVIDIA解决方案架构和工程副总裁Marc Hamilton表示:“欧洲百亿亿欧元的EuroHPC技术路线图为HPC和AI的快速增长和创新打开了大门。我们正在与CINECA和Atos合作,在广泛的应用领域中加速科学探索,为迎接百亿级计算时代提供了一个平台。”
有趣的是,明年会有多少HPC中心选择SuperPOD实现以AI为中心的计算,以及有多少采用Sequana中提供的更标准的HPC面向工作负载的架构?我们希望与AI / HPC世界中其他地方看到的情况相似,在这些地方AI和加速的科学计算应用程序都是GPU密集型的,并且有一些专注于AI的研发中心,需要完整的DGX或SuperPOD。
Nvidia与合作伙伴在欧洲范围内构建多个基于SuperPOD的系统,同时保持其Sequana不仅仅涉及硬件。这些系统的软件和支持生态系统非常庞大,因此,在重建SuperPOD时利润可能微不足道,而它们在支持和牢固生态方面的构成将是无价的,尤其是欧洲在其中扮演的角色比以往任何时候都雄心勃勃。