5 月 11 日消息,在今日凌晨的 Google I / O 大会上,谷歌花了一个多小时的时间来谈论其在人工智能方面的众多进步,例如用于其生成式 AI 巴德的新 PaLM 2 大型语言模型(LLM)。这是在谷歌产品组合中添加人工智能功能的基础支柱,包括谷歌地图、谷歌照片和 Gmail 等等。
除此之外,谷歌还推出了一款性能卓绝的超级计算机 ——A3 Virtual Machines。它采用了第 4 代英特尔至强可扩展处理器、2TB DDR5-4800 内存,以及 8 张英伟达 H100“Hopper”GPU,通过 NVLink 4.0 和 NVSwitch 实现了 3.6 TBps 的对分带宽。
谷歌表示,新的 A3 超级计算机“专门用于训练和服务要求最苛刻的人工智能模型,这些模型为当今的生成人工智能和大型语言模型创新提供动力”。据介绍,这款超级计算机可以提供 26 exaFlops 的人工智能性能。
根据谷歌的说法,A3代表了其 GPU 到 GPU 数据接口的首个生产级部署,允许在绕过主机 CPU 的情况下以 200Gbps 的速度共享数据。这个被谷歌称为基础设施处理单元 (Infrastructure Processing Unit, IPU) 的接口可以使 A3 虚拟机 (VM) 的可用网络带宽比 A2 虚拟机提高 10 倍之多。
英伟达超大规模和高性能计算副总裁伊恩・巴克表示:“谷歌云的 A3 虚拟机由下一代英伟达 H100 GPU 提供支持,将加速生成式人工智能应用程序的培训和服务。“在谷歌云最近推出 G2 实例之后,我们很自豪能够继续与谷歌云合作,通过专门构建的人工智能基础设施帮助全球企业转型。”
如果你想要尝试体验 A3,现可通过谷歌 A3 预览以申请加入早期访问计划。但IT之家这里必须要提醒一下,填写表单只是申请,并不能保证你一定能够通过审核且有资格使用 A3。