这位多家公司的领导者在X上宣布,xAI——通过X向付费用户提供名为Grok的大型语言模型(LLM)和同名聊天机器人——已经开始在世界上“最强大的AI训练集群”上进行训练,这个被称为孟菲斯超级集群的系统位于田纳西州孟菲斯市。
据当地新闻媒体WREG报道,这个超级集群位于该市的西南部,是该市历史上由新进企业进行的最大的资本投资,然而,xAI尚未与当地公用事业公司田纳西河谷管理局签订合同,而该合同是提供超过100兆瓦电力项目所必需的。
满载Nvidia H100
尽管如此,马斯克进一步详细说明,这个集群由10万个液冷的H100图形处理单元(GPU)组成,这些芯片自去年起由Nvidia提供,受到包括马斯克的竞争对手(也是前朋友)OpenAI在内的AI模型提供商的高度需求。
马斯克还指出,该集群运行在单一的RDMA(远程直接内存访问)结构上,这是一种通过不增加中央处理器(CPU)负担来在计算节点之间提供更高效、低延迟数据传输的方法。
xAI 计划在2024年12月前提供“各项指标上最强大的AI”
显然,xAI 计划在超级集群上训练其自身的LLM,但更重要的是,马斯克在回复中表示,该公司目标是在“今年12月前”训练出“世界上最强大的AI”。
他还表示,孟菲斯超级集群将为此提供“显著优势”。
对于他的许多雄心壮志和成功来说,马斯克因公开提出并错过多个项目的截止日期而臭名昭著,如全自动驾驶汽车、机器人出租车和将人类送上火星,所以我不会对2024年12月的新Grok LLM抱太大期待,但如果能在这个时间框架内实现,那将是对xAI努力的一个巨大推动。
尤其是OpenAI、Anthropic、Google、Microsoft和Meta都在追求更强大、更实惠的LLM和SLM的情况下,如果xAI希望在争夺客户、用户和注意力的AI竞赛中保持竞争力,就需要一个新的、有用的模型。
实际上,据The Information报道,OpenAI的支持者Microsoft正与OpenAI首席执行官Sam Altman合作开发一个代号为Stargate、价值1000亿美元的AI训练超级计算机。根据其发展情况,xAI的孟菲斯超级集群可能不会长时间保持世界上最强大的地位。