11 月 14 日消息,Meta 生成式人工智能工程总监谢尔盖・埃杜诺夫近日在硅谷数字工人论坛上分享了他对人工智能推理需求的预测。他认为,明年全球新增的人工智能应用推理需求,如果使用合理规模的语言模型,仅需两座核电站的发电量就可以满足。
人工智能推理是指利用已经训练好的人工智能模型,在实际场景中进行各种任务,如生成文本、回答问题、识别图像等。埃杜诺夫表示,他通过简单的数学计算,估计了明年全球推理需求的用电量。他假设,明年全球会新增 100 万到 200 万个 Nvidia H100 图形处理器,每个处理器的功率约为 1 千瓦。如果每个处理器每天运行 24 小时,每人每天可生成 10 万个“token”。他认为以人类规模来看,这用电量尚属合理。全球仅需新增两座核电站,就可以提供足够电力。
不过IT之家注意到,埃杜诺夫也指出,人工智能的发展还面临着一些挑战和限制,其中之一是数据量的问题。目前,人工智能模型的训练需要大量的数据,而公开的互联网数据已经不足以支撑下一代模型的训练。下一代模型可能需要 10 倍的数据量,这意味着需要更多的专业领域的数据,或者更多的多模态数据,如视频、音频等。另一个挑战是供应链的问题。由于全球芯片产能的紧张,人工智能模型的改进速度也会受到影响。因此,研究人员正努力提高模型的效率,以减少对数据和硬件的依赖。例如,Salesforce 公司开发了 Blib-2,这是一种能够自动调整模型大小的技术,可以根据不同的任务和资源需求,动态地缩小或扩大模型。
业内专家普遍认为,语言模型在两年内将为企业带来巨大价值。埃杜诺夫预计,三四年内我们将知晓当前技术是否能实现通用人工智能。