自从2017年5月AlphaGo以3:0击败当时世界第一围棋手柯洁后。博客、社区、新闻等平台AI相关资讯爆发式的增长起来。很多软件培训学院也先后开启了人工智能学习课程,但门槛都很高,从费用到环境。比如:
- 硬件设备,GPU最便宜的也得2000起步。想实践体验下AI产品没有上万投入是不可能的。
- AI算法,统计学、微分、朴素贝叶斯法、隐马尔可夫算法,这又让多少已经稀疏的程序猿成为了秃头鹰,2018~2019年北京地铁里植发广告剧增。
- 开发环境,很多时候不仅是开发难,搭建开发环境也难。各种安装、配置、修改参数。甚至课程结束了,有的学员还没搞定开发环境。不是某个补丁问题,就是安装时候遗漏了东西,而AI开发还得在GPU上搭建一个环境。不能说很难,但也让人烦恼抓狂。
- 2018年7月4日,在百度AI开发者大会(Baidu Create 2018)上,百度正式公布PaddlePaddle3.0,包括完整的核心框架,以及AI Studio、AutoDL、EasyDL等可以让开发者平等便捷获取顶尖AI能力的组件。
- 2018年7月18日,阿里云正式发布了三款人工智能产品:图像搜索、智能语音自学习平台以及机器翻译,三款产品由阿里云与阿里巴巴机器智能技术实验室联合自主研发。
- 2018年10月举办的华为全联接大会上,华为云发布了更快的普惠AI开发平台——ModelArts。同时提出了发布了沃土AI开发者使能计划。华为公司副总裁、云BU总裁郑叶来表示:“ 华为希望通过沃土AI开发者使能计划,搭建一个技术交流、人才培养、机遇共创的通道,全面助力每一位开发者、每一位老师和每一位合作伙伴”。
我们来了解下这三大厂的AI平台发展到怎样地步,首先我把收集到的三厂AI平台概述给大伙看看:
- 百度机器学习BML(Baidu Machine Learning)是一款端到端的AI开发和部署平台。基于BML,用户可以一站式完成数据处理、模型训练与评估、服务部署等工作。平台提供了高性能的集群训练环境,海量算法框架与模型案例,以及操作便捷的预测服务工具。用户可以专注于模型与算法本身,并得到优质的模型与预测效果。(现在还有个百度大脑AI平台里面主要是飞桨产品)
- 阿里云机器学习PAI平台是构建在阿里云MaxCompute(原ODPS)计算平台之上,集数据处理、建模、离线预测、在线预测为一体的机器学习平台。阿里云机器学习封装了阿里巴巴集团内成熟的算法,向机器学习用户提供了更简易的操作体验,真正做到让人工智能触手可及。
- 华为云ModelArts是面向AI开发者的一站式开发平台,提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。
可以看出目前三家都以帮助开发者快速创建模型,提供一站式开发为主。下面我从一个AI开发者视角来分析下,实际从这几方面来体验三家AI开发平台:1.平台上手体验,2.开发者培养计划,3.平台资源福利。
一、第一项:平台上手体验。
百度
我们先体验百度智能云下的BML(Baidu Machine Learning)。BML包括三个部分:
- 工作区:内置了完全托管的交互式编程环境Jupyter Lab,实现数据处理和代码调试。
- 训练:支持多种深度/机器学习框架,一键发起大规模训练作业,提升训练效率及效果。包括四部分:深度学习作业、机器学习作业、AutoDL作业、AutoML作业。
- 预测:快速将训练好的模型部署为高可用的在线服务,灵活选用多种计算部件加速预测执行,并可以通过A/B Testing,灰度升级,服务监控等完成模型试验迭代和服务运维管理。
工作区:
a.主要是创建实例,管理实例运行的界面。实例创建完毕点击打开Jupter进入代码编辑页面。
b.notebook编辑界面,也是正常的在线编辑平台,不过在左边可以方便查看各个代码文件。这个比较好,方便开发者查询及修改相关文件。
训练部分:
提供了深度学习、机器学习、AutoDL、AutoML四种模式进行模型训练。深度学习提供的算法或框架有tensorflow、pytorch、百度自研发的paddle。
a.深度学习提供的算法或框架有tensorflow、pytorch、及百度自研发的paddle。
b.机器学习有数据标准化、逻辑回归二分类、KMeans聚类。
c.AutoDL有图片分类-ENAS、图像分类-迁移学习。
d.AutoML只有一个LogsticRegression。
预测部分:提供快速创建,及预测模型库。
总体上感觉百度BML封装的内容太多了,适合初学者又不适合初学者。适合的一面让初学开发者不用自己去寻找各个算法来搭建框架。不适合是初学者想尝试调整超参数这些来验证自己的学习内容就不方便实现了。同时,百度还提供了百度大脑AI开放平台包含了(飞桨PaddlePaddle、AI Studio、EasyDL、iOCR、语音自训练平台)。PaddlePaddle是类似TensorFlow 的一个算法框架,不过我这次主要了解下AI Studio。因为,EasyDL、iOCR这两个产品封装的更加彻底,EasyDL是专门用于图片分类、声音分类、物体检测。iOCR则是票据上的文字识别。PaddlePaddle就更不用说了。其他两家都没有,而我这次主要是对比AI开发平台的体验。因此,在百度大脑AI平台上我只选用了AI Studio。
AI Studio
a.AI Studio是以AI项目作为开发引导的一个平台。点进去就看到公开项目、我的项目以及创建项目。不像之前的BML那样从开发到训练到预测。这里以开发训练为主。
b.默认项目框架为百度自研发的paddlepaddle框架。
c.notebook开发模式
d.脚本开发模式
e.图形化模式
小结下:
百度智慧云BML(Baidu Machine Learning)与百度大脑的AI Studio,整个设计界面也很简单直接。建立实例选择训练资源,开发编辑算法代码,在进入训练里面选择对应的算法引擎进行训练,最后发布预测。如果你不是一个才入门的AI开发者,有过相关的开发经验。就可以快速的上手操作体验了。相对百度大脑的AI Studio,则更是一个属于百度的PaddlePaddle算法平台,如果你不怎么熟悉AI开发模式,反而会在里面越搞越迷茫。如果,你是一个才看完吴恩达老师视频的初学者,面对这个平台。你需要再补充些开发的知识才能尝试下。所以,我从一个初学者的角度来说,这个平台还是需要更多的引导及指导的功能。
阿里
阿里云机器学习PAI平台3个子产品,分别是:
- 机器学习可视化开发工具PAI-STUDIO
- 云端交互式代码开发工具PAI-DSW
- 模型在线服务PAI-EAS
为传统机器学习和深度学习提供了从数据处理、模型训练、服务部署到预测的一站式服务。平台架构图清晰说明整个操作流程:
首页概览,里面包含了各项目运行情况。方便开发者了解相关信息。
Studio-可视化建模
a.可视化模型管理界面。
b.项目创建,在创建时提示该名称重名,个人推测该按量付费资源应是公用资源。
c.这里还提供相关模板,初学者在不知道如何操作时,可以点出个模型来简单体验下。
d.可视化拖拽平台。本人水平有限,点了半天没有得到想要的结果。看来还是需要对AI开发有所了解后,才能快速上手。
DSW-Notebook建模:
a.实例创建,12元一小时,千万记得关闭。
b.这界面很舒服,左边有模型项目的导入,右边有实时运行状态,挺有吸引力的。
不过对于我这样英文老大难的来说这个中文忍不住吐槽下。切换到中文只是右边的翻译,只是这种汉化没有左边的有意义。
PAI-EAS模型在线服务:
a.常规的模型发布操作,不过前面操作的模型有误,一直不能有效实现下效果。
小结下:
阿里云机器学习PAI平台在开始有比较详细框架说明及流程引导,方便AI开发人员了解阿里的平台,同时他也多了一个可视化建模的功能,notebook的编辑也很酷炫。但在帮助说明里面提到的数据准备,数据预处理、可视化没有在该平台里发现。总体来说,该平台对于有实践经验的开发者来说是非常有帮助的比百度要好些。一个刚刚学习了几个月的开发者可以试着在上面根据帮助文档来实现模型编辑及训练发布。
华为
最后我们来体验下华为云AI开发平台ModelArts。通过功能总览图 ,可以看出是三家里唯一在AI开发平台里面就提供了数据处理模块的平台,同时我也根据该图的功能顺序进行体验演示。
数据处理:ModelArts提供开源数据集,部分场景实现数据智能标注。
a.数据标注功能,支持在线标注,同时设置标签集。据说在下个版本将推出多人标注工具,这对很多数据公司是个福音啊。
b.智能标注,在标注一定量的图片后,执行智能标注提高数据整理效率。这个功能可以减轻标注人员的百分之80的时间,这个功能还是不错,如图:
c.数据集发布,标注完毕的数据集可以发布出来,提供给相关团队伙伴一起使用。同时,ModelArts也有数据集市场,标注好的数据集可以通过AI市场进行相关交易。
算法开发:自动学习+自动训练模型并调参,简化工作量。
a.开发环境里面提供Notebook,同时支持多达7个算法引擎供大家使用。
b.同时是唯一提供Terminal的,可以当前运行情况有所了解。我的理解为两个结合一起使用可以更加高效编辑算法代码。
c.训练作业:可以选择之前在notebook上编辑好的模型。同时华为也提供了四种不同的模型来源方便开发者选择。同时提供模型的超参调优。
d.运行参数调整及训练结果版本对比。让开发者可以更直观了解每个参数对结果影响。
模型训练
a.训练成功的模型可以在这里查询出来后就能进行相关部署。
b.同时这里的溯源图查看了解模型的超参调整过程。
模型部署,一键式部署,适配到端边云。
a.查询部署出来的模型可以进行相关效果测试。
AI市场:对模型及数据集的交易与分享
小结下:
相比较ModelArts是三个AI平台里更容易上手的,其自动学习让小白用户也可以轻松训练出AI模型。提供了从数据准备、数据集管理、算法开发、模型训练、模型模式、AI市场等AI开发全生命周期的功能,基于此平台可以帮主AI工程师、算法工程师提升AI开发的效率。
接下来,我再把三家的平台功能、操作体验和平台特点汇总说明下。
百度
- 平台功能:提供Jupyter Lab开发、四种深度/机器学习框架、可在线预测、AI市场。
- 操作体验:已经有丰富经验的开发者可以快速上手。
- 平台特点:拥有自己的飞桨算法引擎,同时还多了一个专门学习百度PaddlePaddle的AI Studio。
阿里
- 平台功能:Studio可视化工具、PAI-DSWnotebook编辑开发、模型在线服务、AI市场。
- 操作体验:提供的可视化工具可以让不熟悉代码但对AI有所了解人群适用。
- 平台特点:提供拖拽式开发操作,界面华丽。
华为
- 平台功能:数据标注、算法开发、训练作业、在线部署、AI市场。
- 操作体验:可以让小白轻松学会训练AI模型,整个平台可视化工具,易懂易操作。
- 平台特点:整个AI开发流程详细。从数据处理到最后的部署上线,整个过程都在ModelArts平台里实现。同时在训练作业中支持模型的超参调整,是三家唯一有此功能的。
通过上面的信息我们大概可以了解到三个平台的功能及特色,接下来,我们来了解下三厂目前对开发者有哪些培养计划及相关福利。
二、第二项:开发者培养计划
培养计划(将从各平台提供的学习平台、AI模型案例实践以及平台活动这几点进行比较)
百度
a.开发者活动-首席AI架构师培养计划,门槛很高不适合初学者。
b.在线教材,目前不对外开放。是百度与专业培训机构或大学合作的入口。
c.平台的案例模型支持,里面的还是以介绍产品及AI Studio操作步骤为多。BML没有相关的模型支持。
- AI Studio
- paddlepaddle的一些项目信息介绍。
d.开源平台交流,主要是paddlepaddle的开发使用信息。涉及BML及AI Studio学习信息就不多了。
e.平台社区活动,最近有AI Studio人工智能竞赛活动。
阿里
a.阿里云有一个专门的板块是阿里大学里面还是有很多AI学习视频从python基础开始。觉得自己理论不好的,可以在这里试试。目前阿里云AI认证没有开启。
b.AI平台案例
可视化模型案例,之前也提到了。有丰富的案例模板可以直接点击创建。
e.开发者社区活动,也不知道是不是自己找的方向不对。只找到了这些活动信息。
华为
a.华为云学院课程视频,里面的课程和阿里一样也搭配了相关认证体系。
b.ModelArts-Lab AI 实战营,目前有很多开发者参加了这个活动,帮助开发者一步步成长,而且总共有16期的AI实战!
c.ModelArts新手入门指导,这个对于刚接触的人来说很好的的体验了,完全零基础即可感受AI自动学习是怎么一回事。
d.ModelArts模型案例,在AI市场里,开发者案例分享和交流的平台。
e.华为云社区,可关注公众号(HWCloudAI),获得高质量AI技术文章和最新的技术动态:
f.华为云AI大赛平台:
g.ModelArts开发者交流平台,此社区有大量的AI模型和案例。
h.华为沃土AI人才培养计划,这个也是和学校合作的项目。个人就算啦。
我们再把以上的信息整理出来:
百度
- 在AI开发者的培养上,百度以与培训学校、大学合作为主。社会上的培训也是面对企业,面对经验丰富的技术人员。
- 平台上的案例得在公开项目里面寻找再进行复制。
- 比赛活动有一个2019百度之星开发者大赛
- Github上的交流也是以paddlepaddle产品为主。对于开发平台的介绍很少。
阿里
- 阿里的天池竞赛平台,是三家做的相对更有影响力的。
- 阿里云大学有比较详细的教学视频及阿里的认证体系。可以让开发者在这里再补充自己的理论知识。
- 阿里的PAI开发平台里面就可以直接调用相关的模型案例,这个可以点赞。对于初学者来说如何模仿实现是实践的快速路径。
华为
- 华为在Github上,搭建了一个开发者AI案例交流平台ModelArts-Lab,并且有16期活动,带着AI学习者在ModelArts平台上实践,这个很赞。
- 华为云学院,开设了很多AI课程和AI微认证,参与人还蛮多的。
- 华为的沃土AI人才培养计划,这是面对高校和科研机构,提供大量的AI资源,助力高校的AI人才培养计划。有兴趣的高校可以参与,关键还提供了可以去华为实习的机会。
三、第三项:平台资源福利。
学习是一种投资,AI学习更是花钱如流水。前几年初学者想自己搭建一个硬件训练环境怎么也要投入万把块才有点感觉吧。接下来我们了解下各厂AI开发平台资源费用:
百度
a.BML,目前免费使用,可以放心的薅。
b.同时还有百度大脑AI Studio平台上的。这个羊毛还能薅一段时间。这让我想起当年的百度云盘了,每天签到送云空间。
阿里
a.PAI-Studio 可视化建模平台计费详情。涉及深度学习都便宜不了啊。
b.PAI-DSW 云端Notebook建模平台计费详情。训练量大还是包月吧。
c.PAI-EAS 机器学习模型在线服务计费详情。
华为
a.新用户福利。只要是新注册的就送价值400元的福利包。里面有10小时的GPU使用时间。
b.ModelArtsAI全流程开发公共资源池。1*p100比阿里便宜点。
c.ModelArtsAI全流程开发专属资源池。
d.EVS存储。0.0014元这可以有!
e.自动学习。
目前百度没有收费信息,只能拿阿里和华为进行比较。目前从常用配置环境GPU(P100)来说华为的公共资源7.6比阿里的8.4便宜点。但包月方面则阿里的2000元就便宜的多了。当然,你加入ModelArts实战营还有更多的福利可以领。
同时我再把三家的平台框架放出来大家一起交流下:
百度
阿里
华为
最后我把以上内容整理出来我们可以清楚看出来:
以上分析,希望能帮助到正在转型做AI的程序员!
后记:这里不是推荐百度,阿里,华为哪家的好,只是把我个人学习AI的一个体会分享。分析了几家厂商的AI平台后,最后我选择参加《华为云ModelArts-Lab AI实战营》,最初我参加这个活动,是因为这个实战营不仅提供了云资源,还提供了AI实践案例手把手教我如何学习AI,对我这种AI初学者非常适合。从开始的一路点鼠标,实现了图片识别后,马上尝试做了小程序到处拍照玩识别,到现在每天开始去找资料学习yolov3模型是怎么回事,然后到平台上跑上2个小时训练,去理解每个参数对训练结果的影响或者尝试不同的标识数据方式来优化标注的效果等等。让我感觉到每天是过得不一样的,同时也期待明天可以找到一个更好的模型或者可以实践运行出来一个好的预测结果,只要能提高百分之5的准确率都会非常高兴。因为,这些都是我能参与的操作,不再是看书或者看别人文章。(好东西,给大家分享下,https://github.com/huaweicloud/ModelArts-Lab)