中国AI服务器,刷新全球18项性能基准测试纪录

新闻 服务器
美国东部时间10月21日,全球倍受瞩目的权威AI基准测试MLPerf公布今年的推理测试榜单,浪潮AI服务器NF5488A5一举创造18项性能记录,在数据中心AI推理性能上遥遥领先其他厂商产品。

 本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

美国东部时间10月21日,全球倍受瞩目的权威AI基准测试MLPerf公布今年的推理测试榜单,浪潮AI服务器NF5488A5一举创造18项性能记录,在数据中心AI推理性能上遥遥领先其他厂商产品。

MLPerf是当前全球最具影响力的AI计算基准评测组织,由图灵奖得主大卫·帕特森(David Patterson)联合谷歌、斯坦福、哈佛大学等单位共同成立,每年组织全球AI训练和AI推理性能测试并发榜。此次MLPerf的AI推理基准测试有全球23家公司和单位参与,在数据中心及边缘等场景进行AI计算产品的性能比试。今年MLPerf训练榜单已于7月公布。

浪潮NF5488A5获数据中心AI性能绝对优势

此次浪潮NF5488A5一举创造18项MLPerf推理性能记录,成为创纪录最多的AI服务器。今年的测试中,数据中心AI性能最受关注,全部参与机构提交了507项性能测试数据。浪潮NF5488A5创下了数据中心22个赛项中的13项性能记录以绝对优势领先,NVIDIA DGX取得了5项数据中心性能记录。而在此前的MLPerf训练榜单中,NF5488A5在最核心的Resnet50训练任务中也创下了性能记录,单机性能高居榜首。

中国AI服务器,刷新全球18项性能基准测试纪录

浪潮NF5488A5创造18项MLPerf推理性能新记录

性能大幅提升3倍,全栈AI能力优势凸显

在此次基准测试中,浪潮AI服务器NF5488A5在开放优化(Open)和固定任务(Closed)的ResNet50基准性能测试中,均表现优异,相比2019年MLPerf推理榜单的服务器最好性能提升高达3倍。

中国AI服务器,刷新全球18项性能基准测试纪录

△ 2019、2020年 ResNet50推理性能对比

NF5488A5是浪潮自研的新一代AI服务器,是此次MLPerf全球竞赛中唯一可以在4U空间内支持8块安培架构A100芯片实现NVLink高速互联的AI服务器。浪潮NF5488A5在系统拓扑上采用了超低延迟设计,支持PCIe 4.0全链路极致优化,高频通信单元采用一级拓扑最近连接,最大限度提升处理器到AI芯片间的通信性能。同时,通过配置NUMA节点,确保每颗处理器与其直连的GPU之间通信性能最优,最大限度降低通信延迟。此外,NF5488A5通过深度优化系统结构设计,确保设备可在高温环境下稳定运行。

本次基准测试中,浪潮展示出了卓越的AI计算软硬件协同优化能力。在硬件层面,通过对CPU、GPU硬件性能的精细校准和全面优化,使CPU性能、GPU性能、CPU与GPU之间的数据通路均处于对AI推理最优状态;在软件层面,结合GPU硬件拓扑对多GPU的轮询调度优化使单卡至多卡性能达到了近似线性扩展;在深度学习算法层面,结合GPU Tensor Core 单元的计算特征,通过自研通道压缩算法成功实现了模型的极致性能优化,在精度无损的情况下性能提升近2倍。

中国AI服务器,刷新全球18项性能基准测试纪录

△ 各服务器MLPerf AI推理性能对比(以浪潮NF5488A5为基准,越高越好)

浪潮是全球领先的AI计算领导厂商,其AI服务器在中国的市场份额已连续三年保持在50%以上。浪潮致力于AI计算平台、资源平台和算法平台的研发创新,并通过元脑生态与AI领先企业共同推进AI产业化和产业AI化进程。

 

责任编辑:张燕妮 来源: 量子位
相关推荐

2014-10-23 16:22:05

华为

2009-12-10 18:13:08

Sun

2009-12-10 09:24:06

SunX64AMD

2014-11-03 16:07:03

华为服务器

2019-02-21 22:25:18

曙光

2012-07-03 15:56:53

华为服务器

2009-10-10 11:11:40

服务器测试

2015-05-19 14:11:22

RH2288H V3虚拟化全球测试华为

2020-09-24 19:48:39

R620服务器

2017-02-15 16:22:37

华为

2010-10-18 09:56:33

服务器基准测试SDSPEC

2013-09-18 15:30:42

华为服务器华为RH5885 V2

2017-05-10 15:06:43

联想联想X6服务器

2021-02-02 13:26:56

新基建新华三

2021-01-26 09:29:10

新华三

2017-11-14 12:27:44

ThinkSystem

2016-04-25 17:48:55

FusionServe刀片升级

2011-11-17 13:13:18

戴尔服务器
点赞
收藏

51CTO技术栈公众号