杜克大学副教务长 Lawrence Carin 教授
Lawrence Carin 教授是杜克大学分管科研的副教务长,他于 1985 年、1986 年和 1989 年获得马里兰大学电子工程学本科、研究生和博士学位,并于 1989 年以助理教授身份加入位于纽约的理工大学电子工程系并在 1994 年成为副教授。1995 年他加入杜克大学电子工程系并被提名为 William H. Younger 杰出教授及电子工程系主任。Lawrence Carin 教授的早期研究专注于电磁学和感应,并在过去十年研究应用数据和机器学习。共著有或联合编写超过 300 篇学术论文并涉及人工智能、炸弹探测、视频分析、神经学、癌症、传染病、投票行为及音乐等不同领域。他在炸弹探测领域的研究帮助在北卡研究三角园区创办了一家 Signal Innovations Group 的企业并已雇佣超过 40 名员工。他最近出售了他在这家公司中的股份。Lawrence Carin 教授是美国电子电气工程师协会院士、Tau Beta Pi 和 Eta Kappa Nu 荣誉学会的会员。
2017 年 7 月 25 日至 8 月 3 日,即将迎来第二届杜克清华机器学习暑期课程。值此契机,本课程的独家媒体合作伙伴机器之心对作为该暑期课程组织者之一的 Lawrence Carin 教授进行了专访。专访中 Lawrence Carin 教授介绍了昆山杜克大学博雅通识教育的目标,及人工智能时代人不能为机器替代的能力;他如何用两年时间从初步认识机器学习到成为世界级专家;他作为一个创业者对中国创业者的建议;机器学习暑期课程对学员未来职业的影响;贝叶斯定理、机器学习之于杜克大学的意义;清华、杜克与昆山杜克大学在机器学习领域的合作等等。
以下是采访正文。
机器之心:您似乎是刚涉足深度学习领域。除了媒体的关注度还有技术上的突破外,深度学习对您的吸引力源自何处?
Lawrence Carin:深度学习是一个很新的领域,虽然我可能不是最早接触这个领域的,但也不算太晚。我非常喜欢学习新事物,所以深度学习最吸引我的地方在于:它是一门新技术,并且也非常有前景,同时还因为我并不了解它。
两年前的夏天,我决定开始研究深度学习。于是我大量地阅读和思考,试着用自己的方式理解和追溯事物。所以无论何种情况下,一旦开始钻研并理解一件事,我就会产生浓厚的兴趣,随之就会开始着手研究。我们专心致志研究深度学习已有两年的时间。
机器之心:这么多年,您的研究涉及的话题很广泛。是什么驱动了这么强烈的好奇心?您又是怎样探究各个领域并对其做出贡献?如何一层层探索各个话题的呢?能否和我们分享一些让您在各个领域都成为专家的「认知小技巧」?
Lawrence Carin:有一个很有名的统计学家,叫布莱克威尔,他几年前去世了。他是一个非常出名的统计学家。他说的一些话非常尖锐也很深刻,他的话大概能回答你的问题,也代表了我的想法。他说他从来没有做过研究,他只是喜欢去了解新事物。无论何时你去探索一些事,你就想弄明白它。有时候你研究了别人从没研究过的事物,那么你就可以出版你的发现。他说他的目标从来都不是写论文或者变得出名,他的目标就简简单单的是去理解发现一些事物。对我来说,这也是我的想法。
正如大概在十年前,压缩传感的概念出现了,很多人对此非常兴奋。我对于此一无所知,所以我决定去了解它。结果压缩传感一跃成为了重要的理论。
关于深度学习,我的态度也是一样的。研究深度学习的出发点从来都不是为了写论文或者其他,只是单纯地想要了解它。而在这个过程中,我们得出了一些原创的结果。不管如何,我就是这么做了,不仅坚持了很长时间,还会继续坚持下去。我很享受做研究。
机器之心:无论何时您对一个领域产生了兴趣,就会在这个领域取得很多成果。您每年发表的论文数量远超过平均值。这么高效率的秘诀是什么?
Lawrence Carin:我认为在要求别人高效之前,我自己必须先变得高效。我的全职工作是副教务处长,有满满的日程安排。做研究并不是我的工作,只能称之为爱好。我做研究只有两个时间段,一是每天早上工作开始之前,我早上五点钟起床,六点到八、九点之间做研究;再就是在周末。如果你不热爱一件事,你就不能把这件事做好。这就是为什么我说做研究是我的爱好。
机器之心:就像很多杜克大学人一样,您也信奉贝叶斯定理吗?您认为当一个人思考和研究机器学习的时候会大多数时候用贝叶斯思维吗?
Lawrence Carin:杜克大学非常崇尚贝叶斯定理,其中有一个非常有意思的原因。杜克是一个非常年轻的学校,虽然并不是像昆山杜克大学这么年轻,但仍然还是非常年轻的。杜克始终都在排名前十的大学内,而这些排名前十的学校里,大部分都有很长的历史,有些已经建校超过百年。而仅仅只有八十年历史,仍非常年轻的杜克大学,考虑到凡事不能尽善尽美,所以我们必须要有侧重点。
二三十年前,杜克决定向贝叶斯定理发展。我们不可能所有事都有伟大的成就,那么专注并专长于某一方面就尤为重要。恰好当时,贝叶斯定理还没有成为主流。在那个贝叶斯定理还没有传遍世界各地的情况下,使得将贝叶斯定理做到最好就变成了可能。10 年或 20 年前,贝叶斯观点和优化观点或者称之为频率论者观点之间有着非常严峻的竞争,事实上,这两个观点一直都处于斗争中。
然而现在,人们意识到,这两个观点各有千秋,他们各自扮演着不同的角色,发挥着不同的价值。两者的竞争也在逐渐消失。在机器学习中,优化观点和贝叶斯观点之间的分歧也并不像曾经那么引人注目,而且也不像在统计学中那么显眼了。在任何情况下,贝叶斯观点在机器学习中都是非常强的。
机器之心:您在机器学习领域展现了极强的数学能力,您也同样很关注理论方面的东西,您对于深度学习的效率方面是怎么看的呢?数学的哪个方面能够解释深度学习?在您心中,哪一个理论能用来解释深度学习呢?
Lawrence Carin:我们没有一个明确的理论支撑。正如我所说,两年前我决定开始了解深度学习时,我的目标不是来写论文而是纯粹的理解。所以我认为,渐渐地,深度学习不会再神秘,这也是我一直在向学生们传达的东西。我在之前发表的公开演讲提到了深度学习,用图片和图形来解释了深度学习,这些都是毫无疑问地想向听众传达为什么深度学习是成立的。
和深度学习最接近的是小波。小波是几年前由杜克大学的 Ingrid Daubechies 教授发现的数学领域内的一个理论。小波是一个多角度的数据表达,深度学习也正是如此,多角度的表达。这两者既有区别又有联系。这很有意思,因为深度学习能很好地解决现实问题。所以然和领域都是一个阶段一个阶段发展起来的。大概在七年前,在深度学习还没有出现之前,在机器学习领域最流行的是理论,你必须有证据,你必须有理论支持。那时对于理论是很强调的。结果就是出现了压缩传感。压缩传感在深度学习出现之前是有很大意义的。
压缩传感流行的时候,我很想去理解压缩传感,所以我们研究了压缩传感。大概在 5-7 年前,做研究必须要有理论支撑。有一次有一些研究深度学习的人来找我,他们没有理论,没有定理,但他们有很好的结果成绩。他们真正的改变了机器学习的范例。现在,研究的重心都在于得到好的结果,在于做一些在现实中有意义的事情。当你研究理论的时候你要估计要猜测,但这些可能在现实世界中并不适用。但无论何时我们解决很大规模也很复杂的实际问题的时候,人们是没有耐心研究定理的。就像「好吧,你去研究你的定理吧,做完了告诉我一下。我要去解决实际的问题了。」所以在这就有了一个心态上的变化,这种变化在我看来是很有益的。我觉得之前太侧重理论了,但之后肯定还会出现侧重理论的时候。
有意思的是,当 Yann LeCun 和其他团队研究深度学习的时候,他们说「深度学习真好啊」,他们当然会说深度学习好因为他们就是研究这个的。但无论什么时候别人,就像我,不是第一代开创深度学习的人来研究深度学习的时候,深度学习是成功的。我们就像是独立的验证程序一样,都说深度学习是成功的。你研究的越多,就能得出越多的例子,当你把深度学习应用到实际问题的时候,你会得到很好的结果。当你一遍一遍看这些结果的时候,你就会意识到,深度学习并不是一种转瞬即逝的潮流,而是会一直存在,成为我们的工具箱里的一种工具,不会消失,它是非常真实的。经过一段时间,我们会有一些理论,但这些理论很可能也不会脱离现实。有一些很有意思的故事如果有时间我会讲给你。但是在理论和实践之间肯定有一些妥协,但现在实践是占了上风的。
机器之心:深度学习在演讲和计算机视觉方面都得到了很好的应用。但如果想把它变成一种更可行的计算机科学,在自然语言处理上必须取得突破。你觉得深度学习的发展能革新自然语言处理吗?或者说如果自然语言处理不能取得进展,深度学习就会失去发展势头吗?
Lawrence Carin:我们在自然语言处理上取得了很显著的进展。虽然最深处的东西可能是也可能不是最重要的东西,但就机器学习而言,很多最新的科技都已经取得了进展,对于自然语言处理也是有革新性的影响,对于这整个领域来说也是有革命性的作用。我对于自然语言处理的未来很乐观,是我最乐观的领域之一。
机器之心:所以您是说方法论的复杂程度并不是成功的关键?
Lawrence Carin:是的,这些模型都不一定很深刻。它们可以变得很深刻,但不必要。一些基本的概念几年前就出现了,但是慢慢地才有变化,也被证明非常有效。一些深度学习领域的东西可能是,也可能不是最重要的事。但关键的是神经网络,那是一种设置,我们最后也发现这种设置是很关键的。我们最近做的就是把贝叶斯公式和这些科技都结合起来,然后延展到其他许多领域。无论是哪种情况,我都对于我们现在在语言处理上取得的进展感到很乐观。
机器之心:您创建了一个公司叫 Signal,后来被 BAE Systems 收购了。在一些程度上您是一个很成功的企业家。但现在,人工智能吸引了很多的注意力,很多新兴公司都把发展人工智能科技作为他们未来的目标。对于中国的这些想要利用人工智能科技发明一些新东西,革命性的东西的企业家,您有什么想说的吗?
Lawrence Carin:就像你说的,我确实创建了也出售了一个公司。而我想说,管理一个公司不是一个线形的过程,它也不会按着你期待的方向走下去。在商业领域,最重要的就是关注顾客需求。无论何时你创建了一个公司,你肯定对于你怎么进行下去,你想卖出什么商品有了一些点子。但是进入现实世界时,你所想的很重要的东西,和你交流的人不一定认为他很重要。而你所认为的很微不足道的东西,这些人可能觉得很重要。所以,最重要的就是要接纳别人的意见,要聆听,要灵活。也必须明白,只要你做实验,你就会遇到困难。我们公司就遇到过很多挑战。
另一个建议是,要仔细挑选你的商业合作伙伴。你成功时身边的合作伙伴不一定是你当初开创公司时的身边伙伴。那是因为你是和一群人一起工作的,创建一个公司也是很艰难的过程。因为它不会像你所想地一样发展,你得做出改变,也要应对挑战。当你和一群在压力和挑战下的人一起工作时,你会看到他们身上不同的方面。他们的做事风格不一定和你设想的一样。所以我说你要谨慎挑选你的伙伴。
我得到的另一个教训,可能听起来不太愉悦,但是我觉得是真理:当你开创公司时,一定要请一个很好的律师。也要确保他们制定好这个公司的法律架构。开始时你会觉得一切都很好,每个人都像朋友一样。但慢慢地,你就会意识到各种各样的挑战。我可以告诉你,我开始时是很天真的。但幸好我们有一个很好的律师。我们没进入现实社会时,我还没有意识到一个好律师的重要性。
开创并且运营一个公司是很艰难的,一点也不浪漫。当你回头再看时,你创建了一个公司,你又卖掉了它,听起来很不错,听起来很激动人心。回头再看这段经历是很好的,但是在过程中确实很艰难也很有挑战性。
机器之心:很多计算机科学专业的学生想去谷歌 Facebook 这样的大公司工作。您认为这一项目(杜克清华机器学习夏季课程)将如何以及和在何种程度上帮助到这些学生的未来职业或者研究生涯呢?
Lawrence Carin:对于学生来说,这是他们初次接触到机器学习。这一课程将会从不同视角涵盖很多领域:贝叶斯定理视角,最优化视角。经研究人们会根据自己的性格选择自己倾向研究的领域:所以喜欢贝叶斯的是一种人,喜欢最优化的是另一种人。因此这给学生一个机会,让他们认识到自己适合的领域。当然最重要的是我希望他们能够得到鼓舞,毕竟没什么能够取代努力。在这样的课堂上,你不会学到如何成为一个机器学习领域的大师。学习的方式是你自己静静的端坐几个小时,不断阅读、思考,因为这是一个非常复杂的领域。但这给他们机会让他们看看自己到底能走多远。
对于学生来说,这是他们初次接触到机器学习。还有就是很多导师都是都是年轻人。我们有来自哥伦比亚大学的年轻教授,还有来自德克萨斯大学奥斯汀分校的年轻教授,这位教授还是个中国人。这样中国的学生就会发现原来我的同龄人也可以在像德克萨斯大学这样的世界顶尖学校任教,这对他们的激励作用不言自明。因此我希望这能激励他们,让他们觉得自己也可以做到。当学生们以后在 Facebook 或者谷歌或其他企业工作又或者成立了自己的公司时,回想起这节课,他们会说这节课鼓舞了他们,而不是在这堂课上我学习了我需要知道的知识,因为要学习的知识永无止境。我对这批学生印象非常深刻,他们认真努力。有些事情我们过去是不知道会发生的,但是他们确实发生了。
机器之心:您认为清华、杜克和昆山杜克大学在机器学习领域会迎来怎样的合作?
Lawrence Carin:杜克清华机器学习暑期课程把「杜克」这个品牌带到了中国。清华大学原本在世界上和中国都是一流的大学。把杜克和清华结合起来影响力何其之大。我们想继续举办这样的活动有以下几个原因:第一,这些活动能提高杜克大学和昆山杜克大学在中国和国际上的知名度。第二,在杜克,这样的活动相当于实验,因为我们是在这建立一所真正的大学,我们也准备开设本科项目。
机器之心:和昆山杜克大学一直以来追求的博雅教育相比,人们当然也需要学习如何工作、如何编码,但是您觉得还有哪些重要品质需要与学习编码相结合?
Lawrence Carin:当人年轻时,人们会认为技术是最重要的。可是当我年纪大些,我才发现精英之所以能成为精英是因为他们的人际交往能力,他们能与其他人进行有效的沟通,与他人相处的很好,有团队精神,可以应付各式各样的人,明白生活并不总是顺心如意,能够在控制自己适应这个社会。我认为这些技能是十分重要。实际上当人类的生活变得越来越自动化,当机器学习占据的位置越来越重要时,机器能够做到的事情就变得不那么重要了,毕竟这些事仅仅靠机器就可以解决。做一个有智慧的人,做一个会交流的人——包括口头和书面交流,做一个善于理解的人。
我的意思是我们现在在中国,我不是一个中国人但我得在中国工作,我需要了解中国的风俗习惯,我需要了解如何在中国与人相处。因此我认为这些技能反而越来越重要了。但与此同时,你也要将这些技能和技术结合起来。如果你能够将他们结合起来,那你身上就有了那些重要品质。我的学生遍布世界各地,我经常和他们聊天。我记得其中有一个在英特尔担任相对而言还是比较高层的职位,他和我说「Larry, 你知道吗,他们将我提拔到了这个位置,我们组的人都是斯坦福和麻省理工毕业的,他们提拔了我。」这些有特殊才能的人经常并没有意识到自己其实很特别,这正是他们的特别之处。他其实有着非常好的人际交往能力,因此他和那些来自麻省理工的人其实一样优秀,他能够用别人想不到的方式和他人交流。
因此我觉得,在昆山杜克大学,我们和学生都需要行动起来。这真的很重要。你要知道,如果你在谷歌编码,你不会想听一些压根不懂技术的经理说话。假如他对你指手画脚,你肯定会想:你有什么资格告诉我怎么做,你根本什么都不懂。因此在谷歌人人都要掌握技术。但如果我们将人际交往能力和技术结合起来,你就真的真的变得非常「稀有」了。想想我们在昆山杜克大学要做的,不就是能够培养出一些珍稀人才吗。我们不是一个大规模的学校,我们只是一个「小」学校。因此如果我们能够找到那些独特的人,那些能够将人际交往能力与技术能力结合起来的人,他们将来一定会成为领导者。我的意思是像哈佛和杜克这样的学校能够孕育出领导者的秘诀就在于小规模办学。俄亥俄州立大学这样的大规模学校就很少出现领导者,虽然从它的基数考虑,它应该孕育出不少。我们希望至少一部分杜克的学生是那些真的具有特别之处的人,我们感到很幸运能够在杜克遇到他们。这些特别的人无论如何都是特别的。
机器之心:对于未来的人才,您还有什么建议吗?
Lawrence Carin:最后,我想以一个有趣的小故事结束这个话题:我有一个学生 John Paisley,他是杜克的本科生,他出生在威斯康星州的密尔沃基,他从未了解过中国人,也从未见过中国人,更没接触过中文。但是他在杜克上学,这立马就告诉你他其实很聪明。除了聪明,他也是一个特殊的人。发生了什么呢?当他跟着我上研究生的时候,他开始关注周围的中国人,尽管他以前从没见过。大多数美国人见到中国人是这么个态度:好吧,你是中国人,没什么不好的。但我也没兴趣了解你,你反正要和我说英语,就这样吧。换句话说,你要向美国人靠拢,我会以对待美国人的模式对待你。但我真的不是很想了解你。但 John 不是这么想的。John Paisley 在这边讲学时,他听中国人说中文。他从没接触过。然后他看中国人写字,他会发出这样的感慨:「哇,这真有趣」。因此他开始自学中文,学习怎么写,怎么说。实际上他还考了中国的 GRE,在中国上学。这不仅仅是因为他要去一个中国学校,更因为他想证明自己可以做到。他真的做到了。他在清华任教,最后去了哥伦比亚。像这样的人就是特别的。他技术过关,对这个世界充满好奇,因此想了解中国,他学习了中文,又是一个极佳的沟通者,一个优秀的写作者,一个出色的演讲者。因此 John,是一个领导者。领导者将对世界的理解好奇与高超的技术结合起来。像 John Paisleys 这样的人少之又少。
【本文是51CTO专栏机构机器之心的原创文章,微信公众号“机器之心( id: almosthuman2014)”】