智算中心建设的“暗礁”与“灯塔”

人工智能
从国家的层面来看,顶层设计似乎早已看到了这种趋势,“新基建”一词在把AI看成国之重器的同时,也明确了AI和IT具有同样的公共物品属性:希望每个企业、个体都能用得起,并且因此而被赋能。那么对于AI基础设施而言,如何做到既要用得起又要用得好呢?——必须着眼于降低成本和大规模通用。

是时候让智算中心“普惠自由”了。

一家公司的办公室有电力供应,这能给这家公司带来区别于竞争对手的竞争优势吗?

答案不言自明。

现在人工智能(AI)技术与公司竞争优势的关系正类似于电力之于公司。一百多年来,电力曾给各个产业赋能,AI也同样可以给各个产业赋能。

从国家的层面来看,顶层设计似乎早已看到了这种趋势,“新基建”一词在把AI看成国之重器的同时,也明确了AI和IT具有同样的公共物品属性:希望每个企业、个体都能用得起,并且因此而被赋能。

那么对于AI基础设施而言,如何做到既要用得起又要用得好呢?——必须着眼于降低成本和大规模通用。

[[424059]]

1.什么是AI新基建?

智算中心的一般定义是“融合架构计算系统为平台,以数据为资源,能够以强大算力驱动AI模型对数据进行深度加工,源源不断产生各种智慧计算服务,并通过网络以云服务形式供应给组织及个人。”

其作为人工智能产业发展的重要底层基础设施形态,已经成为世界各国竞争角逐的战略布局。在政策扶持、需求牵引下,智算中心“落地潮”在各地被快速掀起。然而在加快步伐的背后,我国人工智能算力基础设施建设也同样面临一系列问题与挑战。

正如9月11日 ,国家工业信息安全发展研究中心在《新一代人工智能算力基础设施发展研究报告》中指出的两点:

  • 市场对算力的概念混淆,导致建设方向和建设需求错位;
  • 行业定价标准混乱,针对人工智能算力基础设施建设的价格标准并未统一,各地同等规模项目的价格相差巨大。

在建设思路上,中国大多数计算中心采取了算力性能发展优先,再拉动应用发展的策略,忽视上层应用迁移及兼容程度,导致算力系统的初期应用效率偏低,无法完全支撑全面的智能化应用场景需求。

另一方面,算力基础设施和传统基础设施的特征相同,都具有高投入、高风险、高垄断性的特点。实力和能力的限制,意味着智算中心不是满大街都是,而是少量的。

而当前智算中心的建设情况是:哪些地方和企业有能力和实力去建设智算中心,其实没有经过严格的论证,因此导致一些地方的建设的AI基础设施与当地产业发展需求不匹配,出现重建轻用、重复建设等现象。

智算中心的建设成本主要分为三个方面:第一个是基础设施的厂房建设,第二个是需要的服务器、芯片等设备。第三个是后期的运维成本、电费等等。据知情人士透漏:“初步计算,满足基本智算中心的也得一两个亿起步的投入规模。”

但从宏观来看,当前智算中心的建设情况是:目前各地都建,建设成本差距最大达6倍多。据网络公开信息显示,以国内四个人工智能计算中心的折合单位算力建设成本投入为例,可以看到从最高的每100P16位算力投入4.6亿,到最低的7500万,差价达到了6.2倍。

“虽然一些人力成本、电力在地区间存在差异,但六倍的差距差距我还是没有想到的。”国家工业信息安全发展研究中心副总工程师兼信息政策所所长黄鹏转而补充道:“至于原因,我认为是前期调研缺乏,尤其是智算中心的发展处于初期阶段,整个行业还是在摸索、实践过程当中,相信后面随着它发展的越来越好,可持续能力越来越强,成本会降下来。”

话里话外,弦外之音,为了优化国家资源的使用,智算中心的建设应该参考标准,规范行业价格。

2.什么样的基建才能“赋能”?

当前各地建设算力中心有两个目的,第一,通过基础设施投入之后,其本身能够发展成为一个产业;第二,基础设施拥有能力之后,形成产业、企业集聚效应。

前者是将新一代信息技术产业作为它的支撑、支柱性、引领性的产业,例子是浙江,其进行了一系列的数据改革,实现了一网通办,政府的服务能力越来越强;后者是满足赋能要求,赋能需要AI技术的企业创造价值。

虽然是两个目的,但却有同一个内涵:智算中心覆盖很多的科学、工程实验,还有人工智能的测试阶段、推理阶段。因此,智算中心一定要跟当地的实际应用和场景紧密结合。

另一方面,基础设施重在“基础”两个字,智算中心必须开放,首先要能够兼容、支持绝大多数的应用需求,至少80%以上;其次,要有打造生态的“雄心”,能够兼容主流软件应用生态,具备使用面广、迁移灵活、编译开发难度低等特点。

另外,普惠也是新一代智算中心所要做的。智算中心前期需要大量的资金、人力投入,这也意味着前期智算中心的服务价格可能中小企业无法承受,但这种基础设施有一个规律:总成本或许很大,但边际成本非常小,因此,随着使用人数的增多,其平均成本递减。

价格逐渐下降是普惠的一个标志,但必须普惠的另一个标志源于人工智能的特点:越用越智能。只有越来越多的人使用智算中心,增强优势,补全缺点,才能成为现代化强国基础设施的内核。

只有技术被广泛采用,才能使得通用的标准逐渐形成,技术的使用方式也会慢慢变得标准化了,最佳实践被广泛理解和模仿,最后变成基础设施的一部分,这也是新一代智算中心必须普惠的重要原因。

作为一种新型的公共服务平台,《新一代人工智能算力基础设施发展研究报告》也指出,新一代人工智能算力基础设施应考虑其包容性、普惠性、安全性、共享性及节能性,应成为能够覆盖多元算力的创新融合型算力平台、能够兼容行业主流软件的开放包容型算力平台、能够确保自主可信和持续升级的安全可信型算力平台、能够实现资源跨区域流动的快速灵活型算力平台,以及低能耗、高效能的绿色节能型算力平台。

本文转自雷锋网,如需转载请至雷锋网官网申请授权。

 

责任编辑:未丽燕 来源: 雷锋网
相关推荐

2024-09-27 13:00:05

智算中心人工智能云计算

2020-12-21 13:45:09

数据中心智算中心AI算力

2024-04-02 14:26:22

数据中心数字化转型

2012-04-13 17:27:41

曙光重庆超算中心

2024-06-25 16:59:39

2024-05-27 15:52:30

2015-06-10 15:36:51

数据中心

2023-02-06 09:36:00

腾讯灯塔融合引擎

2024-07-01 14:48:52

点赞
收藏

51CTO技术栈公众号