AI热潮正为云基础设施塑造新面貌

人工智能
云基础设施正在经历一场剧变,各家服务提供商争相部署和配置用于AI模型训练的服务器,甚至不惜以推迟其标准服务器硬件的正常更新周期为代价。

随着云服务商优先考虑AI研发、而非传统服务器升级,资本支出正迎来一波猛增。

云基础设施正在经历一场剧变,各家服务提供商争相部署和配置用于AI模型训练的服务器,甚至不惜以推迟其标准服务器硬件的正常更新周期为代价。

这波生成式AI热潮正在重塑众多云服务商的优先事项序列。最近一份报告显示,今年云数据中心基础设施的资本支出将增长30%。

但Omdia云与数据中心研究主管Vlad Galabov进一步表示,哪怕是这样的预测恐怕也跟不上现实情况的发展。

Galabov指出,“一部分云服务提供商刚刚表示,他们可能会将资本支出提高到超出此前预测的水平。再次提醒,预估的资本支出已经增加了约三分之一,如果说还要进一步提高,那么将达到前所未有的规模。”

事实上,根据Omdia目前的估计,今年AI服务器将占到整体服务器资本支出的一半以上(66%),Galabov表示这的确非同寻常。

他同时提到,“我们从未见过如此颠覆性的态势。现在,我们在此前的支出预测基础上又上调了约100亿美元。”

这笔大规模投资来自更广泛的群体,而不仅仅是三大云服务商——也就是亚马逊云科技、Azure和Google Cloud。其中涵盖前十大云服务提供商,但同时也囊括了越来越多像CoreWeave这样正在大力投资于专业AI云服务的提供商。

虽然目前66%的服务器支出用于支持AI硬件,但这部分开销所对应的系统仍未占据云数据中心的大部分部署比例。事实上,根据Omdia的数据,AI服务器仅占出货量的19%,这也从侧面表明这些塞满GPU的设备有多么昂贵。

这就引发了新的问题:所有这些AI系统上的支出,是否会影响云服务商对现有服务器的更新能力。而且实际情况似乎还更加复杂,毕竟各大云基础设施运营商还在更多定制化芯片上砸下了数十亿美元,希望让相应平台运行得更加高效。

Galabov指出,“在最大的云服务提供商当中,我们正在积极整合其非AI服务器基础设施,尽可能帮助其降低AI之外的成本。”

他告诉我们,最典型的例子之一就是谷歌对其视频处理服务器的处置。该公司开发了一款名为视频编码单元(VCU)的定制化处理器,针对H.264视频进行了优化,其中一个协处理器甚至能够取代两台英特尔Skylake服务器。

这意味着在公司的下一波更新期间,他们不再使用较新的服务器一对一替换Skylake服务器,而是通过一套配置有12个VCU的系统替换多台旧服务器。

除此之外,谷歌还针对一种更加高效的视频压缩格式VP9优化了该处理器,也就是说一台拥有20块VCU的服务器可以直接取代好几个机架的Skylake服务器。

Galabov解释称,“也就是说他们无法更新好几个服务器机架,而可以用一台针对该应用程序高度加速和高度优化的服务器将其替代,借此大大节约资金。”

“我们预计这种情况后续会越来越多。Meta也在做类似的尝试,这很可能成为一种普遍趋势。数据库应用程序可能也会经历类似的优化周期,Web基础设施应用程序同样如此。”

(例如Pliops等公司已经推出了硬件加速器,能够提高许多数据库的底层键值存储性能。)

与此同时,不少企业也没有放弃自己的基础设施、转头使用公有云资源,近期反而出现了一种将部分工作负载带回内部的趋势——也就是所谓“云遣返”。

其中一个原因就是,许多公司发现使用公有云资源的成本可能根本就不比自主运营IT系统低,甚至往往更高。这背后虽然有着诸多因素的影响(亚马逊云科技就常被指责存在计费方式过于复杂的问题),但多数情况下似乎主要由资源管理不善所引发。

Galabov表示,“基础设施成本膨胀和基础设施利用不足,导致许多企业投入云怀抱”。但在转向云后,一部分用户继续沿用过去的管理实践,即在习惯上仍然保留大量冗余基础设施容量,最终导致需要为并未实际使用的资源而付费。

出于这个原因,Galabov认为未来市场应当更多关注设施规模的合理性,或者将工作负载放置在最合理的位置。Omdia将其称为“云智能”,Galabov则表示这种表达已经成为行业术语。

Galabov表示至少在不久的将来,他相信企业将越来越多地依赖IT即服务平台(例如Dell Apex或者HPE Greenlake)进行内部计算。

这些平台既能够为客户提供与公有云服务相同的好处,同时设施又位于他们自己的数据中心或者主机托管站点之内。供应商可以提供完整且预先配置的基础设施,负责提供管理服务,并设有随用随付等计费选项。

他表示,“我个人认为应该不会出现大规模的下云趋势,这更像是一种小规模的优化手段。”

这方面的证据是,企业在云基础设施服务上的支出比以往任何时候都更加强劲,今年第一季度的增幅达21%,来到760多亿美元。

目前,所有这些支出中约有72%都流向了三大云服务商。不过同一项调查也发现,Snowflake、MongoDB和甲骨文等二线云运营商的同比增长率更高。

也许这些挑战者以及CoreWeave等专业AI提供商将逐渐削弱三大云巨头的主导地位,或者说目前针对三大厂商的反垄断审查将进一步推动市场开放,让云领域的竞争变得愈发激烈。无论最终结果如何,云服务都将屹立不倒、坚定前行。

责任编辑:华轩 来源: 至顶网
相关推荐

2021-11-21 22:33:46

自动驾驶安全智慧城市

2014-09-24 14:19:09

IT华为

2022-02-17 19:18:10

电动车区块

2017-08-30 18:50:27

联想超融合

2018-12-17 13:00:19

2022-06-28 09:10:32

K8S容器镜像滚动升级

2020-05-07 07:00:00

AI人工智能基础设施

2018-11-02 17:27:16

华为云

2012-05-09 10:53:42

微软Windows Sto

2023-02-08 10:34:37

云计算

2022-02-22 16:01:33

微软人工智能超级计算

2022-02-10 11:54:34

即时基础设施基础设施数字化转型

2023-05-29 10:21:07

云计算数据中心

2023-02-10 07:07:30

云计算基础设施

2023-04-04 16:12:26

云计算多云战略

2011-07-14 08:51:00

VMware云计算

2023-02-18 13:47:04

CoreOS容器操作系统云原生

2009-12-22 13:59:59

惠普基础设施运营

2009-12-18 17:14:25

惠普基础架构

2012-03-06 09:24:30

云计算基础设施
点赞
收藏

51CTO技术栈公众号