如何使机器学习训练更便宜，更有效-机器学习训练

随着越来越多的企业将大量任务转向人工智能，企业很快发现，培训人工智能模型是昂贵、困难和耗时的一项工作。

新公司MosaicML的目标是找到一种新的方法来应对这些挑战，现在正准备推出一种基于云的神经网络训练系统，旨在从算法和系统层面解决问题。

1该公司创始人宣称该想法是通过一种组合——“马赛克(Mosaic)“方法来提高机器学习的效率，这些方法可以一起加速和改善培训。核心思路是，由于机器学习模型在云上、数据中心或本地是昂贵的，关键问题在于消除学习过程中的低效。

目前公司已经构建了两个组件，将成为其未来产品的一部分。Composer是一个用于高效机器学习(ML)训练的开源方法库，可以将这些方法组合成“食谱”，从大约20种不同的方法开始，并对它们的性能好处进行严格的基准测试。随着产品的成熟，还会添加其他方法。

另一个MosaicML组件是Explorer，这是一个可视化工具和界面，企业开发人员可以通过比较成本、质量和运行实验所需的时间来模拟、绘制和选择运行模型的最佳路径。Explorer旨在为用户提供在标准基准上进行的数千次训练运行中所衡量的成本、时间和质量权衡的可视化结果。用户可以通过方法、云和硬件类型进行筛选，以达到最佳的运行测试协议。

关键是这些技术要让传统训练过程更高效。

这种想法和需求来自人工智能、机器学习和最初创建及测试模型的步骤。传统方法中，人工智能开发人员想出了一些基本可行但效率相当低的方法。深度学习的世界一直在证明，东西可以工作，但不是高效的，但这无关紧要，因为计算(算力)相对便宜。问题是，这只在模型很小的时候是正确的。

一旦模型变得非常大，它的计算方面实际上变得非常昂贵，如今正处于人工智能行业的一个拐点，模型变得非常大，数据集也非常大，所以现在的费用非常大。在GPT-3(延展阅读：DaaS企业级GPT语言建模问世)的训练花费500万美元——这可能只是一个花费500万美元的实验。

这就是MosaicML开始在人工智能和机器学习领域看到机遇的地方。

MosaicML首席执行官表示：“我们关注的是那些核心竞争力不是人工智能的企业，但它们需要能够以成本效益高的方式使用这些技术，从数据中提取价值。如果你是Meta(原Facebook)或谷歌，你有一个庞大的团队可以做到这一点，他们可以节省昂贵的计算，自己管理。他们最终可能也会使用这些工具，但他们并不真的需要我们。商用企业是我们的首要目标。”

MosaicML发布了它的开源库，以便潜在的客户和开发人员可以使用它，并了解它的功能和特性。但目前产品尚未正式命名，预计将于2022年初推出免费版本和付费支持版本。

“当你训练一个模型时，你真正关心的是成本。”他说。但之后你会开始考虑其他因素，包括事情需要多长时间以及它的效果表现如何。

这个Explorer可视化工具可以让你看到不同。如果不想花那么多钱，只是做一些廉价的实验，就可以试试它。这个想法是给用户提供工具，让他们了解东西的成本。但如果他们没有任何想法，就真的无法计划，进行这些实验就会变得非常困难。最初，MosaicML将在云计算中的模型上工作，因为这些变量更容易根据每个供应商的费率成本来衡量。

人工智能的流行将更多的组织带到了高性能计算(HPC)领域，不管他们是否愿意。对于任何进军高性能计算领域的组织来说，模型创建和优化都是最大的挑战之一，这当然比简单地获取硬件还要困难。

行业分析专家称，这是一种可行的方法来帮助更多的人工智能用户。MosaicML正在解决模型优化问题，有一些优化，如Nvidia TensorRT，针对特定硬件进行优化，但MosaicML则追求算法优化。用于训练的人工智能硬件非常昂贵，而且是非常高端前沿的技术。如果你能将培训时间减少50%，就能相应地降低成本。而且客户也不需要以超高的价格聘请高端人才。