2023年5月,锐捷网络作为首批领航者计划合作伙伴,受邀参与中国信息通信研究院、中国通信标准化协会 CCSA TC610 SDN / NFV / AI 标准与产业推进委员会共同发起的“自智网络领航者计划”授牌仪式。同时,由中国移动研究院联合锐捷网络等产业合作伙伴共同编写的《全调度以太网技术架构白皮书》正式发布。多年来,锐捷网络坚持创新数智网络,以“筑算网基石,创数智未来”为目标,以前沿网络技术提升高性能智算网络产品方案能力,夯实云网新型基础设施基石。
2023年5月,锐捷受邀参加“自智网络领航者计划”授牌仪式
当前,AIGC(AI-Generated Content,人工智能生产内容) 发展迅猛,业内大模型已推出千亿、万亿级参数量,底层GPU算力部署规模也达到万卡级别,对智能算力的需求不断增长。在AI大模型的训练中,网络的性能成为了制约其规模扩展和性能提升的关键因素,一旦网络性能不佳,就会影响分布式训练的质量和速度。因此,互连计算资源的网络必须尽可能高效且具有成本效益,否则当网络表现不佳时,高价值算力得不到充分利用将造成集群的低效。同时,智算中心的网络芯片、网卡芯片长期处于技术体系复杂、封闭垄断的局面,导致通信行业中的上下游企业难以在其基础上协同创新。以太网作为在生态系统、性能/规模、成本、标准调整等方面具有诸多优势的技术,虽受到了国内外众多专家的青睐,但也存在为提升拥塞控制和负载均衡效率而强制进行算法协议优化的问题。
那么,面向未来智算中心规模建设部署,如何建立开放生态发展以太技术用于HPC/AI网络,如何打造无阻塞、高带宽、超低时延的高性能网络成为提升算力能力的关键,也成为国内外数据中心网络领域研究的重要课题。
为突破智算中心网络性能瓶颈,打造开放的无阻塞、高带宽及超低时延的新型智算中心网络产业链生态,助力AIGC等高性能业务快速发展,中国移动研究院联合产业界原创提出全调度以太网技术(GSE Global Scheduled Ethernet)。在2023年5月云网智联大会主论坛上,中移动联合锐捷网络等十多家合作伙伴发布《全调度以太网技术架构白皮书》,明确了全调度以太网的总体架构、GSE网络核心技术和演进路径,并在中国通信标准化协会(CCSA China Communications Standards Association)成功立项相关行业标准。
2023年5月,锐捷参与的《全调度以太网技术架构白皮书》在云网智联大会发布
8月19日,在2023中国算力大会主论坛上,锐捷网络受邀参加“全调度以太网(GSE)推动计划”,其目标是凝结产业各方力量,突破关键技术,推动标准和开源发展,打造开放、标准、兼容的新型以太网协议体系,全面提升智算中心网络规模和性能,支撑AI等高性能业务的快速发展。
9月9日,在2023年中国网络大会上,中国移动研究院携手锐捷等合作伙伴发布“全调度以太网(GSE)”样机。此次发布的全调度以太网(GSE)样机为GSE核心技术实现的原型系统,对后续GSE关键技术研究和应用推广具有重要意义,标志着我国在AI网络方案的重要突破。
2023年9月,中国移动携手锐捷发布“全调度以太网GSE”样机
GSE样机为1U的盒式交换设备,支持32个100GE端口,可以同时兼做GSP和GSF的硬件底座。在功能上支持基于报文容器的全路径“喷洒”转发,端到端DGSQ请求及授权调度机制,以及报文乱序重排等,可满足各种大模型的流量优化需求。经过真实环境验证相较传统方案性能大幅提升,相较于RoCE网络,GSE网络在AllReduce及alltoall两大流量场景训练业务完成时间(JCT)大幅缩短30%以上,算力效率得到明显的提升。
中国网络大会上展示的GSE样机
锐捷网络作为智算中心网络建设领军者,积极支持业内联合开发创新,支撑超大规模的算力集群建设,践行以太无损网络解决方案的路线,并且推出了AI-Fabric智算中心网络解决方案,天然支持无损机制和负载均衡,无需算法优化和网络调优,解决RoCE组网的局限性。同时,锐捷网络不仅在国内与移动深入合作,为研发全调度以太网(GSE)技术积极贡献力量,而且在国际上已成为UEC超以太网联盟 (UltraEthernetConsortium,UEC) 成员。未来,锐捷网络将始终以开放的态度全面拥抱面向下一代智算网络的创新技术,助力实现对以太网标准的优化和对高性能网络的革新,在未来网络技术领域持续贡献力量。