【51CTO.com原创稿件】基础设施即服务(IaaS)是把IT基础设施作为一种服务通过网络对外提供,并根据用户对资源的实际使用量或占用量进行计费的一种服务模式,是云计算的重要基础环节。IaaS包括的存储、计算环节,带来了庞大的芯片需求。这些芯片供应集中在有限的几家公司,根据市场调研机构IDC的报告,英特尔占据了服务器CPU市场近九成的份额,英伟达占据独立GPU市场份额近八成。这一方面使得云厂商的产品趋于同质化,且价格高居不下。各大云厂巨头也意识到了这样的境况,希望通过自主研发芯片来降低成本,同时,在人工智能、物联网等大潮之下可以打造自己的差异化优势。
各云大厂将自研芯片作为一个竞争突破口
2019年7月,阿里巴巴旗下半导体公司平头哥发布了RISC-V处理器玄铁910,为终端提供算力基础设施。在2019年云栖大会,平头哥发布了阿里第一颗芯片含光800,这是一颗针对场景深度定制的芯片,刷新了多项纪录。今年的云栖大会上,阿里巴巴发布了首款通用芯片--倚天710,该芯片是业界性能强劲的ARM服务器芯片,性能超过业界标杆20%,能效比提升50%以上。
今年11 月,腾讯在数字生态大会上也公布了三款自研芯片,分别用于人工智能模型推理计算、视频转码和帮云服务主机加速,预计数月后投入使用。
有消息称,微软也要走上自研服务器芯片的道路,以期更加主动地掌控成本与性能。
亚马逊云科技作为云计算的老大哥,也是最早开始自研服务器芯片的云厂商。2015年,亚马逊云科技以3.5亿美元收购了以色列芯片公司Annapurna labs,开始为云基础设施设计开发定制芯片。
从Graviton开始的自研芯片之路
亚马逊云科技于2018年发布了第一代Amazon Graviton 处理器,支持该处理器的A1也成了其云服务上第一个基于ARM的实例。
2020年,亚马逊云科技发布了第二代自研处理器Amazon Graviton2,这款处理器基于64位的ARM Neoverse N1内核,与Cortex-A76近乎类似,但是加入了不少针对基础设施工作的强化特性。
Graviton2采用了台积电的7nm制程工艺,集成了64颗核心,在CMN-600 Mesh互联技术的支持下可以做到2TB/s的带宽。与第一代Graviton相比,Graviton2提供4倍的计算核心,7倍的计算性能。基于Graviton2的实例与同等级的x86实例相比,性能要高上40%,成本却要低上20%。不仅如此,同样的能耗下,Graviton2的性能要比亚马逊云科技中的其他处理器高上2到3.5倍。在Graviton2的助力下,亚马逊云科技在2021服务器领军榜中位居ARM架构服务器处理器榜首,在市场、价格优势、性能、可靠性和创新5个评价维度位居第一名。
除了基于ARM架构的通用计算芯片Graviton,亚马逊云科技的自研芯片还有机器学习训练芯片Amazon Trainium,和机器学习推理芯片Amazon Inferentia。
在今年的re:Invent大会上,亚马逊云科技发布了新一代自研芯片Amazon Graviton3。Graviton3是Graviton系列的第三代产品。亚马逊云科技表示,相比Graviton2,Graviton3的计算性能提高了25%,浮点性能和加密性能是原来的两倍,机器学习性能则是原来的三倍,同时能耗降低了60%。Graviton3还增加了新的指针身份验证功能,以提高安全性。
三款自研芯片打造计算的核心
大会上,亚马逊云科技还宣布推出了三款由自研芯片支持的新Amazon Elastic Compute Cloud (Amazon EC2)实例,帮助客户显著提升在Amazon EC2上运行的工作负载的性能、成本和能源效率。新C7g 实例由Amazon Graviton3 处理器支持,与由 Amazon Graviton2 处理器支持的当前一代 C6g 实例相比,性能提高25%。由Amazon Trainium芯片支持的新Trn1实例为在Amazon EC2中训练绝大多数机器学习模型提供最佳性价比,及最快的训练速度。基于自研Amazon Nitro SSDs(固态驱动器)的新存储优化型Im4gn/Is4gen/ I4i实例为在Amazon EC2上运行的I/O密集型工作负载提供最佳存储性能。这些基于亚马逊云科技自研芯片的新Amazon EC2实例的发布,将帮助客户支持其关键业务应用程序。
芯片是计算力的核心。亚马逊云科技Amazon EC2副总裁David Brown表示:“我们对自研芯片的持续投入升级,已经让客户在当今一些关键工作负载中获得了巨大的性价比优势。客户希望我们在每一代新的EC2实例上不断突破边界。亚马逊云科技的持续创新让客户有机会使用这些全新的、改变游戏规则的实例运行其重要的工作负载,获得更好的性价比。”
亚马逊云科技大中华区产品部总经理顾凡表示,自研芯片只是亚马逊云科技在计算领域创新的一个例子,其路径目标在于寻求更好的方法,让每项工作负载在“云”上获得更高的性能和性价比。
亚马逊云科技大中华区产品部总经理顾凡
中桥调研咨询(Sino-bridges)首席分析师王丛指出:“5G和IoT的加速对于低能耗高性能AI推理算力提出新需求。亚马逊云科技刚刚发布的Amazon Graviton3让实例性能在上代Amazon Graviton2基础上进一步提升20%, 能耗效率提高60%。对于中国用户,不仅加快AI资源和AI创新能力的适配效率,同时,能够支持持续技术升级,优化AI/ML的长期投资保护。”
re:Invent全球大会作为历年云计算领域的行业峰会,每一年都会在大会上重磅推出很多值得关注的产品和服务,今年当然也不例外。除了三款由自研芯片支持的新EC2实例,亚马逊云科技还发布了大量的,包括推出了六项Amazon SageMaker新功能,为三种数据分析服务推出无服务器功能,让开发人员更加轻松、快捷地创建现实世界的数字孪生的Amazon IoT TwinMaker、帮助企业在其设施中快速建立5G专网的新的托管服务Amazon Private 5G等等。亚马逊云科技正在以探路者的精神,赋能各行业的创新,成就更多各行业的探路者。
【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】