3 月 2 日傍晚,知乎上爆出一则 AI 人事变动大消息——Caffe 作者贾扬清将从 Facebook 离职。
短短数小时,就有近 10 万人浏览这个问题。不仅如此,据 AI 前线爆料,贾扬清离开 Facebook 之后将在阿里硅谷研究院担任 VP,于今年 3 月 11 日正式入职。
新智元向贾扬清本人及阿里方面求证,对方均未回复。3 月 27 号的 ScaledML 会议议程中,贾扬清也是作为 Facebook AI 架构总监出席。
另一方面,贾扬清离职的消息在业内已经传播,杜克大学教授陈怡然也发微博称:阿里硅谷研究院从此开启“一硬一软”两大学霸天王领导模式,在 AI 研究领域势如破竹。
陈怡然指的“硬”,就是美国某高校计算机架构方向的教授,而“软”就是贾扬清。
或许,对贾扬清本人来说这只是又一次“普通的换工作”,但考虑到他目前在 Facebook 的职位——AI 架构总监,以及传言中的下一站——阿里达摩院硅谷实验室,这都将成为 2019 年最重要的人事动态之一。
从 Caffe 到 PyTorch,贾扬清的 AI 架构大神之路
贾扬清以深度学习框架 Caffe 作者的身份闻名。清华本硕毕业后,在加州大学伯克利分校取得计算机科学博士学位,先后工作于NEC 美国实验室、谷歌大脑,2016 年加入 Facebook 担任研究科学家,现任 Facebook AI 架构总监,负责前沿 AI 平台开发及人工智能研究。
贾扬清在伯克利读博期间开发了深度学习框架 Caffe,全称“Convolutional Architecture for Fast Feature Embedding”,以优异的结构、性能和代码质量成为迄今受欢迎、成功的开源深度学习框架之一,对领域发展起到了极大的推动和影响。
后来,贾扬清加入谷歌大脑实习,期间参与了 TensorFlow 平台的开发。2016 年 2 月,贾扬清加入 Facebook,当时这一消息也在圈内引发了广泛讨论。详见新智元报道 Caffe 作者贾扬清:我为什么离开 Google,加入 Facebook?
此后,贾扬清在 AI 架构的大道上一路进击:
2016 年 11 月,Facebook 推出轻量级模块化的深度学习框架 Caffe2Go,能在手机上运行深度神经网络模型。贾扬清代表团队在 FB 官网发文,“我们在移动设备上开发了一个新的深度学习平台,实现了实时的捕获、分析和像素处理——这一先进的技术仅在手上就能实现。……Caffe2Go 与 Torch 等研究工具链一起,构成了 Facebook 机器学习产品的核心。”
2017 年 4 月,Facebook 宣布开源产品级深度学习框架 Caffe2,带来跨平台机器学习工具。Caffe2 是 Caffe 实验性的再造,制作时重点考虑了表现力、速度和模块化等特性。在 2017 年 9 月的一次测评中,Caffe2 以 79% 的精度和 149 秒的运算时间,在 TensorFlow、PyTorch、MXNet、CNTK 等框架中排名靠前。
2018 年 5 月,Facebook 正式公布 PyTorch 1.0,这是基于 PyTorch 0.4 与 Caffe2 合并而成的框架,还整合了 ONNX 格式,旨在一个框架中统一研究和生产的能力。
从深度学习开源框架群雄割据,到现如今 TensorFlow 和 PyTorch 分庭抗礼,贾扬清也从 Caffe 作者走到了 Facebook AI 架构总监。
他担任了 PyTorch 1.0 项目的共同负责人,2017 年创建了开放模型格式的原型,后来成了 FB、微软、亚马逊和许多硬件供应商一起发布的 ONNX。
从谷歌大脑、Facebook 到阿里,换个地方继续飞
对于贾扬清的离职,Facebook 软件工程师晓飞在知乎上给出了这样的回答:
对于大牛来说,从来不迷恋大公司的光环,平台只是实现自己职业发展的跳板。
或在大神环绕的环境里努力成长,学习核心技术,最终成为独当一面的技术大牛;或凭借自身优异的情商智商脱解决问题,和团队一起创造更多价值,最终成为能带领众人的团队领导。
所以,在 Caffe2+Pytorch 合并,我司内部动荡,负面新闻不断的情况下,贾扬清的选择,无非是找到一个更适合自己发展的平台,换一个地方继续飞。
贾扬清是浙江绍兴人,早先在彭博新闻的一次采访中,当被记者问到未来是否会有回中国工作的可能性时,贾扬清表示:“这是一个比较复杂的问题,需要考虑到家庭和各方面的原因。”
过去几年,BAT 等公司大举建立 AI 研究院,并且在美国尤其是硅谷、西雅图等 IT 重镇开设分部,吸引了一大美国的 AI 人才,当然其中有很多是华人。
这不仅仅是 BAT 在走出去,很大一部分原因也是为了降低已经在国外工作和生活多年的华人工程师和研究人员“回到”中国公司的门槛。就好像马化腾把研究院开到了微软对面,是因为很多研究人员“不愿意离开西雅图”。
2017 年 10 月的云栖大会上,阿里巴巴宣布成立全球研究院——阿里巴巴达摩院,3 年投入 1000 亿人民币吸引人才。达摩院在全球各地组建前沿科技研究中心,包括美国的圣马特奥(临近旧金山湾区)、贝尔维尤(华盛顿州)。
这次传言中贾扬清的下一站,大概率就是位于圣马特奥的达摩院硅谷研究院。
在 Facebook 新的一篇文章中,贾扬清贴出了他参观杭州保俶塔的照片。
贾扬清在 Facebook 的一篇文章中分享了游览杭州保俶塔
虽然保俶塔距离阿里巴巴总部仍然有很远的距离,但要入职阿里,哪怕是在硅谷研究院工作,但肯定先要去杭州总部办理相关手续,因此这张照片也为贾扬清加入阿里一说增加了可信度。
AI 开源框架生态方兴未艾,业界还有诸多好戏
根据贾扬清 LinkedIn 页面介绍,他加入 Facebook 后,创建、发展和分拆了多个团队,现在统称为 Facebook AI 架构组 (Facebook AI Infrastructure)。
作为 AI 架构总监,他领导一支由研究人员和工程师组成的团队,全面构建 Facebook 的大规模人工智能平台,支持广告、Feed、搜索排名、计算机视觉、语音、自然语言处理、VR 和 AR 应用程序等 AI 产品用例。
机器学习有可能解决世界规模的难题。但是,要支持重大工程问题,也就需要大规模可扩展的机器学习。如今,AI 架构和平台的研究和开发具有越来越大的现实意义。
2018 年 4 月,贾扬清在 ScaledML 大会上介绍了 Facebook 如何利用机器学习,包括 Facebook 用于机器学习的硬件和平台、框架。
Facebook 的机器学习系统是一个支持 20 亿用户的平台
针对 Caffe2 和 PyTorch 的合并,贾扬清在知乎上表示,将这两个框架整合起来可以极大提升开发效率,为广大开发者提供便利。
因为 PyTorch 有优秀的前端,Caffe2 有优秀的后端,整合起来以后可以进一布优化开发者的效率。目前 FAIR 大概有超过一半的项目在使用 PyTorch,而产品线全线在使用 Caffe2,所以两边都有很强的动力来整合优势。
开发效率是我在 Facebook 非常重视的一个方向:去年年中的时候启动了 ONNX 项目(初版的代码是我亲自上手写的),然后帮助搭建了 ONNX team,增强不同框架甚至不同公司之间的协作;Caffe2 和 PyTorch 在代码层的合并也是从那个时候开始逐渐推动的一项内容。
2018 年 12 月,阿里开源深度学习框架 XDL,面向广告、推荐、搜索等场景,重点打造工业级分布式运行能力,并且能与 TensorFlow、PyTorch 等现有开源框架无缝对接。
贾扬清在朋友圈评价,XDL 是“非常实际的工作,不在框架这个层面上重复造轮子,而是关注框架以上,应用以下的大规模计算抽象和系统抽象,这应该是开源框架稳定以后业界的大趋势”。
或许相比两年前,如今深度学习开源框架和编译器的生态似乎已经走入了较为稳定的时期,但竞争远远没有平息。接下来,随着 AI 技术大规模应用以及渗透到更多领域,或将涌现更多的 AI 引擎和产业级深度学习框架。
更重要的是,在目前 AI 框架领域,还缺乏出自中国的产品。无论是百度的 PaddlePaddle,还是腾讯的 Angel,都没有与 TensorFlow、PyTorch 或 MXNet 一较高下的实力。
如果贾扬清真的加入阿里,或许可以期待一个中国的框架登上大规模 AI 架构的舞台。总之,无论如何,期待大神的选择和未来。