机器学习等计算密集型技术的发展带来了高碳足迹,并加剧了气候变化。机除了快速增长之外,还有不断扩大的绿色人工智能工具和技术组合,以帮助抵消碳排放并提供更可持续的发展道路。
根据微软和艾伦人工智能研究所,以及希伯来大学、卡耐基梅隆大学和人工智能社区hugsFace的共同作者上个月发表的研究,环境成本很高。微软Azure机器学习产品经理、绿色软件基金会成员、该研究的合著者威尔·布坎南(WillBuchanan)表示,该研究推断数据表明,对于一个60亿参数的ML模型(一个大型语言模型),一个训练实例产生的二氧化碳相当于在一辆大型火车车厢里燃烧所有的煤。
弗雷斯特研究公司(Forrester Research)分析师阿比吉特·苏尼尔(AbhijitSunil)说,过去,代码是在受限于有限资源的嵌入式系统中优化的,比如手机、冰箱或卫星。然而,AI和ML等新兴技术不受这些限制,他说。
“当我们拥有看似无限的资源时,优先考虑的是编写尽可能多的代码,”Sunil 说。
人工智能是适合这项工作的工具吗?
绿色人工智能,也就是让人工智能发展更可持续的过程,正在成为解决算法耗电问题的可能方案。布坎南说:“这都是为了降低技术发展本身的隐性成本。”
蒙特利尔人工智能伦理研究所创始人兼首席研究员、绿色软件基金会标准工作组主席阿布谢克·古普塔(AbhishekGupta)表示,任何开发人员的出发点都是要了解人工智能是否适合这项工作,并弄清楚为什么首先要部署机器学习。
“你并不总是需要机器学习来解决问题,”古普塔说。
古普塔表示,开发人员在部署 ML 时还应该考虑进行成本效益分析。例如,如果使用机器学习将平台的满意度从 95% 提高到 96%,那么这可能不值得为环境付出额外的代价,他说。
选择碳友好地区
布坎南说,一旦开发人员决定使用人工智能,那么选择在碳友好地区部署模型会对运营排放产生最大影响,将软件碳强度率降低约 75%。
布坎南说:“这是当今任何开发者都可以使用的最有影响力的杠杆。”
古普塔举了一个例子:开发商可以选择在加拿大魁北克省运营,而不是在美国中西部地区运营,因为那里的电力主要来自化石燃料。而加拿大魁北克省90%以上的电力来自水力发电。
在决定机器学习工作应该在哪里运行时,企业还必须考虑能源类型以外的其他因素。2021 年 4 月,Google Cloud推出了绿色区域选择器,可帮助公司在选择运营地点时评估成本、延迟和碳足迹。但 Buchanan 说,并非所有云提供商都可以轻松获得此类工具。
他说,为了解决这个问题,绿色软件基金会正在开发一种名为Carbon AwareSDK的新工具,该工具将推荐最佳区域来启动资源。在接下来的几个月内应该会提供 alpha 版本。
其他环保的方法
古普塔说,如果唯一可用的计算机位于电力不畅的地区,开发人员可以使用联合学习式部署,其中训练以分布式方式在电力体制中存在的所有设备上进行。但联邦学习可能不适用于所有工作负载,例如必须遵守法律隐私考虑的工作负载。
古普塔说,另一种选择是让开发人员使用tinyML,它通过量化、知识蒸馏和其他方法来缩小机器学习模型。他说,目标是最小化模型,以便可以以更节省资源的方式部署它们,例如在边缘设备上。但由于这些模型提供的智能有限,它们可能不适合复杂的用例。
“整个行业的趋势是认为越大越好,但我们的研究表明,你可以反驳这一点,并明确表示你需要为工作选择合适的工具,”布坎南说。
消费指标可能是解决方案
布坎南说,绿色软件基金会和其他倡议在衡量和减少软件的碳足迹方面取得了进展。
例如,微软去年在 Azure 机器学习中提供了能耗指标,使开发人员能够查明他们最耗能的工作。这些指标侧重于耗电的 GPU,它比 CPU更快,但消耗的能量是 CPU 的 10 倍以上。 布坎南说,GPU 通常用于运行 AI 模型,在功耗方面通常是最大的罪魁祸首。
然而,布坎南说,仍然需要更多可互操作的工具,指的是目前可用的零碎的绿色人工智能工具。“绿色软件基金会正在做一件事情,”他说,“但我认为云提供商需要进行协同投资,以提高能源效率。”
古普塔表示,最终的目标是引发行为改变,让绿色人工智能实践成为常态。“我们这样做不仅仅是为了会计目的,”他说。