数据中心未来:智算中心能否应对AI时代的挑战?

原创
人工智能 数字化转型
可持续、高效、韧性、适应性将成为数据中心未来发展的关键。

随着云计算、大数据、物联网等技术的广泛应用,各行各业对算力的需求呈现指数级增长。尤其是生成式AI技术的广泛应用,使得算力需求翻了数倍。根据《算力基础设施高质量发展行动计划》的预测,到2025年,中国算力规模将有望超过300 EFLOPS,智能算力的占比将达到35%以上。

算力需求的爆炸式增长,这不仅催生了对计算能力的巨大需求,也对数据中心的传统架构提出了挑战。为此,数据中心正在向更加智能化、高效化的智算中心转型,以更好地支持人工智能的应用和发展。

人工智能正在重构整个价值链,包括从芯片,到服务器,再到数据中心。此前,在2024年施耐德电气创新峰会之算力未来数据中心论坛上,施耐德电气高级副总裁,关键电源业务中国区负责人朱文沁指出,“智能算力的迅猛增长对基础设施提出了更为严峻的挑战,未来的数据中心不仅需要具备更加远大的愿景,也需要更为全面的价值考量。可持续、高效、韧性和适应性成为未来发展关键。”

数据中心的尽头是智算

传统数据中心,主要由服务器、存储设备和网络设备组成,设计初衷是为了满足一般的计算和存储需求。然而,面对人工智能应用的高计算量和大数据处理需求,它们暴露出计算能力不足、能耗高、扩展性差等局限性。

智算中心,是在数据中心的基础上,集成了人工智能(AI)、机器学习(ML)、深度学习等先进技术的计算平台。它不仅提供数据存储和处理能力,还具备智能分析和决策支持功能。

相比之下,智算中心配备了大量高性能计算硬件,如GPU、TPU和FPGA,这些硬件能够高效处理深度学习和大数据分析任务。智算中心采用大规模分布式计算架构,可以同时处理来自不同来源的大量数据,提升数据处理效率和计算速度利用人工智能技术实现资源的自动调度和优化管理,根据实际需求动态调整计算资源,提升资源利用率和系统响应速度。

智算中心与数据中心的主要差别还体现在架构、性能、可扩展性、成本和安全性等方面。智算中心使用虚拟化技术和云服务来提供计算和存储资源,这种架构上的变化使得智算中心能够更灵活地响应业务需求,快速部署新应用或服务。在性能方面,智算中心利用高速网络和分布式存储技术,有效提升了处理高性能计算和大数据处理的能力。在可扩展性方面,智算中心几乎无差的全采用虚拟化技术,以及云计算搭载应用,所以在扩展性方面,以及对短时内高并发业务的响应速度方面,完胜传统数据中心。

据报道,英伟达全球智算中心建设计划投资额高达3万亿美元,微软和OpenAI拟投资1000亿美元打造“星际门”智算中心项目;亚马逊云科技规划在未来15年内,投入约1500亿美元用于全球数据中心的建设与运营……视线调转国内,国家信息中心与相关部门联合发布的《智能计算中心创新发展指南》显示,目前全国有超过30个城市正在建设或提出建设智算中心。

可见,全球均在加大对智算中心建设的投入力度。这不仅是技术发展的必然趋势,也是市场对高效、智能、安全计算资源的迫切需求。

智算中心四大愿景:可持续、高效、韧性、适应性

两年前,在行业看来40KW的功率密度已经非常高。然而,去年这一数字已经上升到60至70KW。到了今年,机柜的功率密度更是达到了120KW。数据中心的功率密度正在以惊人的速度增长。以英伟达展示的32000块GPU组成的人工智能工厂为例,据推算,这样的规模大约需要500多个微模块和400多个机柜来支持,机房的IT流量可能在50MW到60MW之间,这远远超出了过去对数据中心IT容量的传统认知。

算力需求急剧增加直接导致了机柜功率需求的显著提升。

为了应对这一挑战,数据中心必须加强电力保障能力,以确保在电网不稳定或停电情况下的稳定运行。此外,随着机柜功率的增加,传统的热保护关机时间已不再适用。智算中心需要实现连续制冷,以避免因过热导致的设备宕机,这要求数据中心在制冷侧进行持续的技术创新和管理优化。

同时,为了适应更高的功率密度,数据中心的空间布局也必须进行优化。增加的制冷和通风系统配置意味着每个机柜所需的空间将显著增加,这直接影响了数据中心的规模和设计,也对数据中心的选址和建设带来了更多的限制。

也就是说,数据中心向智算中心的转变不仅涉及到硬件设施的升级,更涉及到数据中心规划、建设和运维的全方位变革。朱文沁指出,“‘可持续、高效、韧性、适应性’将成为数据中心未来发展的关键。”

适应性强调数据中心需要具备灵活的设计和维护能力,以及对下一代IT技术的兼容性,包括软件定义技术的发展和主动能源管理。可持续性不仅要求最大化利用可再生资源,助力企业实现其可持续发展战略。高效方面,数据中心应更有效地利用能源和资源,同时确保资本投入得到充分利用,具体体现在部署速度和空间占用的优化。韧性则超越了传统的高可用性概念,不仅需要优秀的设计以增强能源和冷却系统的冗余,还需关注网络安全和预测性分析,以全面保障数据中心的稳定运行。

愿景落地,需创新推动

数据中心的转型升级,仅有愿景是远远不够的。“可持续、高效、韧性、适应性”这四个关键词的背后涉及到供配电、制冷、机柜和软件管理等一系列的挑战,愿景的落地需要创新的技术产品进行驱动。

在2024年施耐德电气创新峰会的算力未来数据中心论坛上,施耐德电气重磅发布与英伟达的合作成果,推出首个面向智算中心的参考设计。这一设计专为部署英伟达的高性能加速计算平台而量身打造,旨在为智算中心提供标准化的数据中心生态系统内的AI部署和运营基准,并且也可以作为解决高密度机柜的通用智算中心解决方案。

从存量数据中心改造到新建智算中心的机电系统设计,覆盖设施供电、制冷、IT机房、全生命周期软件四个技术领域,该参考设计凭借一套框架体系,为赋能构建高效、可持续与可扩展的基础设施提供有力支撑。

在推出参考设计之前,施耐德电气已为赋能智算中心做了充分的准备。截至目前,施耐德电气已经发布了超过230本白皮书,其中《中国数据中心可持续发展之旅》白皮书进一步帮助数据中心行业定义了可持续发展的关键要素,并提供了衡量指标与有效路径,为数据中心的转型升级提供了理论支持和实践指导第110本白皮书深入探讨了AI对数据中心带来的颠覆性挑战,并为每个物理基础设施类别提供了应对指南。

同时,施耐德电气针对数据中心的转型升级,推出了一系列创新产品,以支持适应性、韧性、高效和可持续性四大核心愿景。在适应性方面,公司推出了适配AI智算中心的冷板式液冷CDU系统,以及I-LINE Track中电流母线,能契合用户实际也无需求,有效实现节能增效。

高效性方面,施耐德电气SmartCool末端空调节能解决方案使空调末端基于IT负载实时需求进行动态制冷输出,实现秒级同频优化,在进一步提升数据中心制冷能效的同时,兼顾客户可持续发展与业务的持续增长。

在韧性建设上,施耐德电气不仅提供强大的中低压配电设备,还推出了ETAP全新电气系统数字孪生平台,基于强大的数字孪生和模拟仿真能力,优化数据中心和电力系统设计,提升效率,并能预测并预防设备问题。

可持续性方面,施耐德电气提供了全面的节能降碳解决方案,涵盖设备级、系统级到管理级,并融入人工智能与数字孪生技术,以最大化能源效率。

伴随全球AI加速爆发,智能算力的布局已是箭在弦上,不得不发。作为数据中心变革的影响者和赋能者,施耐德电气已经准备就绪。尚处于观望,抑或是处于迷茫状态的“局中人”,施耐德电气提供的解决方案和专业指导或许是可参考的解题之道。

责任编辑:刘芯 来源: 51CTO
点赞
收藏

51CTO技术栈公众号