我们正在见证一个巨大的计算机创新阶段。快速加速的全球5G推广与数据密集型工作负载以及生成型人工智能的突破性发展相交叉。整个计算生态系统前所未有地需要灵活性,以创新和探索新型加速、新型系统架构和新方法来应对不断增长的数据消费需求。半导体设计成本上升和全球能源预算紧缩带来的额外挑战意味着我们正处于全球计算基础设施转型之中。
5G与人工智能的结合蕴藏着巨大的机遇。 5G技术可以提供人工智能应用收集、传输和处理大量数据所需的高吞吐量、低延迟和可靠的连接。 作为回报,人工智能可以帮助 5G 网络动态分配资源、管理流量和检测异常。 人工智能还可以利用 5G 为用户和设备提供个性化、情境化的智能服务。 这两项技术将共同真正改变我们的沟通、工作和生活方式。
但每个故事都有两个方面。 5G 和人工智能给数据中心运营商和客户带来了重大挑战,因为两者都会产生大量数据,需要以灵活、及时、经济和节能的方式存储、处理和分析。 为了充分利用这个机会,数据中心架构师需要围绕计算的设计、构建和部署方式寻找变革性方法。
5G 虚拟 RAN:边缘数据中心的关键推动者
支持 5G 的关键创新之一是虚拟无线接入网络 (vRAN)。 vRAN 是一种相对较新的部署模型,正在流行。 它将蜂窝基带处理功能与硬件解耦,并将其作为软件在通用服务器上运行。
这可以在部署和管理 5G 网络时提供更大的灵活性、可扩展性和效率。 虚拟化 5G 基础设施的规模经济可以通过多种方式实现。 第一,结合相同的计算基础设施来服务 5G 连接和边缘应用程序,使连接和数据处理更接近源; 其次,软件驱动的云原生基础设施可实现动态资源分配、负载平衡、更快的配置和自动化网络管理,这对运营效率产生巨大影响。 第三,借助光纤连接,vRAN 可以将多个基站汇集到一个集中式服务器池中,从而降低 5G 基础设施的成本和复杂性。
通过使计算能力更接近最终用户及其设备,vRAN 可以促进边缘计算,同时减少延迟并提高性能。
但为了充分发挥其潜力,vRAN 需要计算平台能够支持高吞吐量、低延迟和确定性的无线电信号处理,同时保持非常高的计算效率。 它还需要高速网络接口来处理服务器、无线电和终端设备之间的大量数据流量,这进一步强调了对变革性方法的需求。
当今的 5G 数据中心:CPU 和 DPU
传统通用 CPU 无法处理 5G vRAN 堆栈复杂且多样化的工作负载。 通过将所有网络功能虚拟化为软件,包括操作系统、网络层、应用程序和协议,数据中心内的流量急剧增加,从而降低了 CPU 效率。 为了应对这一挑战,CPU 需要一个补充性的专用加速设备,可以卸载 CPU 的网络任务,以提高性能和效率。 当今 5G 数据中心最流行的加速设备之一是数据处理单元 (DPU)。
5G 基础设施中的人工智能。(来源:Arm)
DPU 是具有嵌入式处理器或可编程逻辑的网卡,可以执行网络功能,例如数据包处理、加密/解密、压缩/解压缩、负载平衡、防火墙、路由/交换和服务质量 (QoS)。 DPU可以通过接管部分网络相关任务来帮助降低服务器的CPU利用率和功耗,从而实现根据不同场景配置和优化网络功能的灵活性和可编程性。
异构计算为未来的工作负载增加了更多灵活性
虽然当今的 5G 数据中心已经利用 CPU 和 DPU 来支持 vRAN 和其他 5G 应用,但下一代 5G 数据中心将需要在硬件架构、软件平台和服务模型方面提供更大的灵活性。 例如,数据中心可能使用 GPU 来处理复杂的数学、图形、视频或其他大型数据集; 用于机器学习工作负载的 GPU 或 TPU; 以及用于可编程逻辑的 FPGA,以解决更多自定义工作负载。
这种类型的异构计算有助于提高融合智能边缘数据中心的性能、效率和可扩展性,这些数据中心可以提供更接近最终用户的RAN服务、云计算能力和人工智能应用服务。 最终,将更专业的计算移至更靠近设备和最终用户的位置,可以改善延迟并实现 5G 所承诺的许多下一代用例。
软银、英伟达和 Arm 最近宣布合作,旨在为人工智能和高性能计算 (HPC) 创建世界上最先进的数据中心。 它是当前此类数据中心转型的最佳示例之一,具有专门的处理功能。 此次合作预计将为基于 Nvidia GH200 Grace Hopper 超级芯片的生成式 AI 和 5G/6G 应用提供一个开创性的平台,软银计划在日本各地新的分布式 AI 数据中心推出该平台。 与过去使用的数据中心相比,新数据中心的分布将更加均匀,并可处理人工智能和 5G 工作负载。 这将使他们能够以低延迟更好地以峰值容量运行,并大幅降低总体能源成本。
为了在全球范围内快速部署生成式人工智能应用和服务,软银将与英伟达合作建立数据中心,在多租户通用服务器平台上托管生成式人工智能和无线应用,从而降低成本,提高能效。
这种类型的创新代表了5G和人工智能的重要拐点。围绕专门处理提供的目标性能构建的整个数据中心为运营商提供了实现vRAN潜力所需的操作效率。此外,专门的处理使运营商能够在同一物理位置共同托管人工智能或3D视频会议等计算密集型服务,从而更接近数据,更接近用户。这一点至关重要,因为灵活性、低延迟和性能效率确保了计算资源的最佳使用及其所需的资本和能源成本,从而改变了整个数据中心的TCO(总拥有成本)等式。
当我们展望下一代5G数据中心时,对灵活高效的计算平台的需求至关重要。在5G和人工智能的推动下,为了满足对数据中心服务日益增长的需求,下一代数据中心将被定义为适应新技术和工作负载的能力,并提供企业和消费者所需的性能和效率——我们将继续看到高效、专业的硅作为该领域创新和转型的基础。