【51CTO.com快译】机器学习是一个研究领域,让机器无需直接编程就能学习。由于许多学生、教师、开发者和数据科学家使用机器学习来开发各种项目和产品,机器学习开发方兴未艾。然而,开发机器学习模型对系统规格有很高的要求,因为有时模型训练过程可能需要2小时到2天甚至更久。因此,低端系统无力处理机器学习模型的训练;就算勉强可以训练模型,也很可能会出现严重的系统问题。
然而有许多开源机器学习环境可用,它们对系统规格没有任何要求,可使用云基础架构在最短的时间内训练模型。以下是几种高效和常用的在线机器学习环境:
1. Google Colaboratory
这是谷歌提供的一项易于访问的云服务,用于开发产品和项目。它支持免费的GPU,基于Jupyter Notebooks环境。它为所有人提供了一个论坛,以便使用广泛使用的库(比如PyTorch、TensorFlow和Keras),构建机器学习和深度学习应用。它让您的系统可以不必处理机器学习活动的全部工作量。它是同类中最成功的平台之一。
- 内存—12 GB至26.75 GB
- 磁盘空间—25 GB
- CPU核心—2个
- 支持的语言—Python
2. IBM Watson
IBM推出了支持开源解决方案的Watson数据平台和数据科学体验(DSX)。它终于推出了可自由选择的多云平台,以处理数据科学工作。这是借助通过Kubernetes实行容器化来实现的。因而,它可以分布在存储数据的Docker或CloudFoundry容器中。
- 内存—16GB
- 磁盘空间—90 GB
- CPU核心—4个
- 支持的语言—Apache Spark、Python、R和Scala
3. Kaggle Kernel
这是面向云端深度学习和机器学习应用的出色平台。 Kaggle和Colab有诸多相似之处,都是谷歌的产品。它在浏览器中支持Jupyter Notebooks。Jupyter Notebooks的许多键盘快捷方式与Kaggle几乎相同。Kaggle拥有庞大的数据集,还有广泛的社区致力于宣传、学习和验证数据科学技能。GPU和TPU的使用在Kaggle内核中有一些方面的限制。
- 内存—25GB
- 磁盘空间—155 GB
- CPU核心—1个
- 支持的语言—Python和R
4. Coclac
它是用于计算、研究、协作和编写文档的虚拟在线工作区。这包括使用各种科学语言,提供LaTeX、R/knitr或Markdown中的创作文本功能、基于Web的Linux控制台、时间旅行功能以及聊天室和课程管理等网络资源。然而,其大多数功能仅供付费用户使用。
- 内存—16GB
- 磁盘空间—20 GB
- CPU核心—3个
- 支持的语言—Julia、Octave、Python、SageMath和R Statistics等
5. Microsoft Azure
微软的Azure Notebooks在功能上与Colab相似,但以速度取胜,这方面比Colab好得多。Azure Notebooks是一系列链接笔记本,名为Libraries(库)。这些库还能存储您的数据,假设每个数据文件都小于100MB。Azure Notebooks更适合基本应用。Azure仅提供12个月的免费服务。
- 内存—可变
- 磁盘空间—可变
- CPU核心—可变
- 支持的语言—Python、R和F#
原文标题:Top 5 Open-Source Online Machine Learning Environments,作者:Rituraj Saha
【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】