随着机器学习和人工智能的迅猛发展,业界出现了许多开源的机器学习平台。由于机器学习与大数据天然的紧密结合,基于 Hadoop Yarn 的分布式任务调度仍是业界主流,但是随着容器化的发展,Docker + Kubernetes 的云原生组合,也展现出了很强的生命力。以下是为大家精心总结的机器学习平台和工具,现在已经可作为资源将ML的强大功能无缝集成到日常任务中。
1. Eclipse Deeplearning4j
Eclipse Deeplearning4j是一个为Java虚拟机构建的开源库。适合有DIY倾向的人,以深度学习为核心,本工具针对那些需要在分布式CPU和GPU工作的商业环境中构建深度神经网络的开发人员。 Scala、Clojure和Java程序员可以使用像Hadoop这样的文件系统。
2. Accord.NET Framework
图像和音频处理库以C#编程语言编写,然后与Accord.NET框架相结合。功能强大,在里面开发人员可以创建一系列商业用途的应用程序,这些应用程序依赖机器学习,比如计算机视觉、信号处理、模式识别和计算机视觉。这样有多种可供选择,开发人员可以利用图像和信号处理、科学计算等。
3.微软Azure ML
Microsoft Azure ML是一个MLaaS平台,提供了一个带有两个模型创作环境的工作室:自动化ML和设计器。它还可以将模型转换为可自动伸缩的预测api。允许用户查看和可视化地编辑模型训练管道,即获取数据、准备数据和应用ML算法生成预测模型的操作序列。通过避免接口捕获的缺少数据操作的输入或禁止的连接,设计器使理解、创建管道变得更容易。
4.Lobe
Lobe是微软于2018年收购的一项服务,它也提供交互式画布和自动功能,但也允许用户处理图像功能。它提供了一个易于使用的环境来自动建立神经网络模型,通过一个可视化的界面。模型是由可以完全控制的构件组成的(波瓣建立在TensorFlow和Keras之上),培训可以通过实时的交互式图表进行监控。训练好的模型可以通过开发人API提供,或者导出到Core ML和TensorFlow文件,在iOS和Android设备上运行。
5. TensorFlow
TensorFlow专为在依赖机器学习的项目中使用而设计,它具有作为使用开源软件设计的平台的附加优势。在大量的在线资源、文档和教程的帮助下,TensorFlow提供了一个包含数值计算形式的数据流图的库。目的是让开发人员能够跨多种设备启动深度学习框架。
6. DiffBlue
DiffBlue是比较罕见的开发工具,它是一个非常有用但简单的平台,致力于代码自动化。 DiffBlue有几个核心目的:测试编写、错误定位、重构代码以及发现和替换弱点的能力,这些都是使用自动化完成的。
7. Neon
它是由Intel和Nervana开发的,Neon是一个基于Python的ML库,并且是开源的。使用其工具的开发人员可以利用技术先进的应用程序和智能代理。在云环境中,它支持云计算,支持开发人员开发、构建和训练深度学习技术。
8. OpenNN
一个C ++编程库,OpenNN主要针对那些想要实现神经网络的经验丰富的开发人员。 工具旨在通过创建表格、图表和其他可视内容来解释和简化数据条目。