2023年9月,IEEE集成电路与系统杂志(IEEE Circuits and Systems Magazine)的总编辑陈怡然教授和副主编陈凡教授非常荣幸地采访了丛京生院士。
丛院士是世界电子设计自动化 (EDA) 和高性能计算领域的杰出学者,本次采访围绕着丛院士卓越的职业生涯的各个方面提出了六个问题。
丛京生院士个人简介
丛京生院士是加州大学洛杉矶分校(UCLA)计算机科学系Volgenau Chair for Engineering杰出教授及前系主任,并兼任UCLA电子与计算机工程系教授。
同时,丛院士是美国国家工程院院士、中国工程院外籍院士、美国计算机协会会士(ACM Fellow)、电气和电子工程师协会会士(IEEE Fellow)和美国国家发明家学院院士 (NAI Fellow),并于近日刚刚当选美国艺术与科学院院士 (AAA&S Fellow)。
因在电子设计自动化和FPGA设计方法领域的重要贡献,他于2022年荣获集成电路界的「诺贝尔奖」IEEE Robert Noyce Medal。
他还是UCLA领域特定计算中心 (CDSC) 和超大规模集成电路架构、综合和技术 (VAST) 实验室主任。
丛院士的研究方向包括:用于可定制计算的新型架构和编译、超大规模集成电路系统综合以及量子计算。
在这些领域丛院士先后发表了 500 多篇论文,其中包括 18 篇最佳论文奖,以及4篇入选现场可编程门阵列(FPGA)和可重构计算名人堂(FPGA And Reconfigurable Computing Hall of Fame)的论文。
丛院士和他的学生们共同创立了AutoESL。该公司开发了被后来广泛使用的 FPGA 高层次综合(High Level Synthesis)工具AutoPilot。在被Xilinx(现并入AMD)收购后更名为Vivado HLS(随后又更名为Vitis HLS)。
专访
问题一:您的教育背景令人印象深刻。您拥有北京大学计算机科学学士学位,以及伊利诺伊大学厄巴纳-香槟分校(UIUC)的计算机科学硕士和博士学位。是什么原因促使让您选择了计算机科学专业?您的求学经历对您在学术界的职业生涯有何影响?您可以给有志在计算机科学领域取得优异成绩并有所建树的同学以及同仁们什么建议吗?
丛院士:我与计算机科学的渊源,特别是在电子设计自动化 (EDA) 领域,走过了一条迂回曲折的道路,充满了意想不到的转折。
我成长于北京,从小就对数学感兴趣,并且在全市数学竞赛中获得了一些奖项。1981年,我入选了国际数学奥林匹克竞赛团队,但最终竞赛团队由于一些原因未能成行。尽管如此,北京大学数学系还是邀请了我们整个团队成员去学校参观,并鼓励我们申请入学。参观完北大数学系之后,我几乎决定把它列为大学的第一专业志愿。但在回程的路上,我决定去计算机科学系参观一下,来了解计算机系的项目和课程。我一直很好奇为什么计算机能比人类计算快那么多。
北大计算机科学系当时还处于建设初期阶段,办公场地还只是借用了教职工宿舍楼的几个房间。在那里我很幸运地遇到了一个我感觉非常博学的“教授”,他向我介绍了计算机科学专业的众多课程,例如数字逻辑、计算机体系结构、算法、离散数学等等。这次谈话激发了我的兴趣,促使我之后在填报志愿之前的最后一刻决定将计算机科学专业列为我的第一志愿。进入计算机科学系后,我去感谢那位帮助我做决定的“教授”,却发现他只是一个负责记录所有学生成绩的工作人员,难怪他对所有课程都了如指掌!
在北大本科期间,我喜欢所有的计算机科学课程,我最喜欢的几门课程中就包括了离散数学。这门课涵盖了集合、逻辑、图论等内容,为计算机科学的大部分理论奠定了基础;其次是算法课,算法决定了我们编写的每个计算机程序的效率;同时我对图论尤其着迷,图是一种简洁高效的数据结构,可以用来表示不同应用中的各种关系,也是许多算法中使用的关键数据结构。我和其他几位同学还组织了一个针对图论的读书小组, 开始攻读Frank Harary的《图论》一书。我们的读书小组很幸运地得到了离散数学教研室负责人王攻本教授的指导。我们的离散数学课程选用的是伊利诺伊大学厄巴纳-香槟分校 (UIUC) 的刘炯朗教授 (C. L. Liu) 的教材。这本书用简洁易懂的例子解释了复杂的概念,让我对这位教授敬佩不已,并渴望从他那里学到更多知识。巧合的是,王教授曾是UIUC的访问学者,他大力推荐我前往刘教授门下攻读博士学位。最终我如愿以偿地被UIUC录取,并成为刘教授的学生。
1986 年冬天,我抵达UIUC开始我的博士生涯。当时刘教授的研究兴趣正转向应用领域,尤其是超大规模集成电路 (VLSI) 的计算机辅助设计 (CAD),现在称为电子设计自动化 (EDA)。我对这个全新的领域感到陌生,甚至一度考虑更换导师。但最终,我决定给自己一个机会,先深入了解一下EDA这个领域。经过一个学期的学习,我发现这个领域缺乏高效的算法和实现,因此有大量的需求和机会。事实上,我和刘教授以及黄定发教授合作的第一篇论文发表在ICCAD 1987会议中,该论文提出了利用图算法来实现一种紧凑的三层电路板自动布局布线新方案。从那以后,我便在离散数学领域找到了自己的兴趣所在。这成了我的博士时期和在UCLA的研究生涯的主要研究领域。
根据我自身的经历,我想和年轻的学生们分享几点心得体会:
- 好奇心:探索的起点
我对计算机的最初好奇心引领我走上了探索计算机科学的道路。正是这种好奇心,驱使我不断学习、探索,最终成为一名计算机科学家。
- 热情:创新的动力
至今,每当我学习到一种巧妙的组合算法时,仍然会感到兴奋不已。我对算法研究充满热情,并致力于在该领域开发出新颖的算法。追求真正让你兴奋的东西,可以让你做出有意义的贡献。
- 拥抱未知:开放的心态
1986年,我决定花一个学期的时间去探索EDA这个完全陌生的领域。这段经历让我打开了新世界的大门,也让我收获了许多意想不到的惊喜。如果当初我没有保持开放的心态,我将会错过这个领域中许多令人兴奋的进展和乐趣。
- 应用与探索:平衡的策略
在科研道路上,我始终坚持平衡应用与探索,这也是在强化学习(reinforcement learning)领域中采用的基本策略。一方面,我积极利用现有知识和成果进行更深入的研究,不断取得新的突破。另一方面,我保持开放的思想,勇于探索未知领域,寻求新的机遇。
问题二:您作为计算机科学领域尤其是在现场可编程门阵列 (FPGA) 技术和物理综合方面的杰出学者,对该领域的贡献巨大。您的四篇论文入选现场可编程门阵列和可重构计算名人堂,这是全球范围内所有同行研究人员中获奖数量最多的。您能详细说说您是如何找到重要的研究问题并着手研究的吗?此外,您是如何思考并提出创新的技术方法的呢?
丛院士:我认为EDA领域的创新与半导体和集成电路 (IC) 技术的进步密不可分,两者共同推进了摩尔定律所述的集成电路设计复杂性呈指数级增长。因此,我特别关注半导体/IC的技术拐点,这些拐点往往需要EDA领域的创新研究来提出新的解决方案。自1990年我加入UCLA以来至今,我发现了以下三个值得注意的拐点:
1)互连瓶颈
随着晶体管在20世纪90年代初微缩到亚微米尺寸,互连延迟开始盖过逻辑延迟,成为决定时钟频率的主要因素。因此,我在UCLA主持的第一个美国国家科学基金会项目就是「用于高性能VLSI电路和系统的互连问题」(1991-1993年),旨在解决当时迫切的互连挑战。我们提出了许多新的研究方向例如互连拓扑优化、最优导线尺寸、同步布线和寄存器插入、使用物理层次结构而非逻辑层次结构、探索3D设计等等来解决这个问题。这些研究成果的大部分内容总结在一篇发表于Proceedings of the IEEE 2001年4月刊的应邀论文「An Interconnect-Centric Design Flow for Nanometer Technologies」中。
2)片上系统 (SoC) 机遇
21世纪初,芯片上的晶体管数量突破亿级大关,将整个电子系统集成到单个芯片 (SoC) 上成为可能。一个典型的例子是Xilinx在2002年推出的Virtex-II Pro FPGA首次集成了一个IBM PowerPC内核。这也促使我们重新审视高层次综合 (HLS) 技术。
HLS是一个在1980年代提出的概念,但当时并未流行开来。我们认为使用高层次软件描述语言 (C、C++或SystemC) 来定义SoC规格并直接生成硬件描述RTL代码会更加高效。此外HLS还可以缓解互连瓶颈问题,通过HLS调度,可以让信号在多个时钟周期内跨越长距离互连 (这项HLS自动化技术与算法 AutoBridge最终发表在了2021年FPGA会议上并获得了最佳论文)。尽管当时主要的EDA厂商对HLS投入不足,但上述优势让我们看见了HLS的潜力并促使我们进军HLS领域进行研究。我们之后的研究取得了几个重要成果,例如基于平台的HLS、编译时使用差分约束进行调度优化以及自动内存划分。这些技术最终促成我们创立了一家名为AutoESL的公司。AutoESL于2011年被Xlinix收购,其开发的HLS工具成为了后来AMD/Xilinx的旗舰产品Vivado HLS和Vitis HLS的基础,并广泛应用于FPGA设计领域。我们的HLS研究成果在以下两篇主旨报告应邀论文中进行了重点介绍:
- 「High-Level Synthesis for FPGAs: From Prototyping to Deployment」 (IEEE Transactions on Computer-Aided Design, 2011)
- 「FPGA HLS Today: Successes, Challenges, and Opportunities」(ACM Transactions on Reconfigurable Technology and Systems, 2022)
3) 登纳德缩放(Dennard scaling)的终结
20世纪末,半导体行业遇到了一个关键挑战:传统的提高时钟频率的方法已经无法满足性能提升的需求,这种现象被称为登纳德缩放的终结。当时的业界普遍认为多核并行化是解决问题的关键,而我们则另辟蹊径提出了以定制化为主的集成电路的设计理念。
定制化集成电路指的是根据特定的工作负载调整架构,以获得更好的性能/能效比。2008 年,我带领一支由 12 位教授组成的团队,向美国国家科学基金会 (NSF) 提交了一份名为「可定制领域特定计算」的提案。该提案获得了极具竞争力的NSF计算远征奖 (NSF Expeditions in Computing Award),并促成了UCLA领域可定制化计算中心 (CDSC) 的成立。在过去的 15 年里,CDSC 中心在可定制化计算领域取得了重大进展。我们不仅在架构设计、编译和运行支持方面取得了突破,还将应用领域拓展到了医学成像、深度学习、精准医疗和大数据处理等多个领域,开发了许多创新的加速器。我们在这方面的研究成果发表总结在2019年Proceedings of the IEEE上的应邀论文「Customizable Computing-From Single Chip to Datacenters」中。如今,领域特定计算的愿景已经得到业界广泛认可。在过去的5-10年间,谷歌、微软和亚马逊等主要云计算提供商都开发了他们自己的定制化加速器。
我的研究始终围绕着一个核心目标:寻找半导体/IC的技术拐点,并为EDA领域提出创新解决方案。通过这种方式,能够确保我们的研究始终紧贴行业前沿,并在快速发展的领域中产生实质性影响。
问题三:您的研究团队多年以来始终处于研究的前沿,并且最近又在量子计算领域做出了杰出贡献。您能详细介绍一下您如何保持对自身领域最新研究进展和进步的了解吗?您如何确保您的研究始终处于前沿地位?
丛院士:终身学习是我全力提倡并享受的一项基本原则。为了让自己始终保持在研究领域的最前沿,我所付出的努力如下:
阅读是保持专业知识更新的基石,正如我之前提到的「探索与应用」原则一样。我既会阅读我专业领域的最新刊物,例如DAC、ICCAD和FPGA等会议论文,也会更广泛地涉猎整个科学和工程领域的资料(例如每周的《科学》杂志和每月的《Communications of ACM》),从中或许能发现意想不到的灵感。为了培养持续学习的文化,我鼓励我的学生每天阅读一篇论文,我也会尽力做到这一点。
数字时代带来了丰富多样的网络课程。我本人也受益于参加许多网络课程,其中既包括与我的研究相关的科目,例如量子计算和量子力学,也包括与研究不直接相关的领域,例如心理学和世界历史。我这么做纯粹是为了享受学习的乐趣。有时候我会为了督促自己真正学习到一项知识而注册认证课程。
与来自不同学科的同事合作也是一种收获颇丰的学习途径。例如,我有幸与应用数学领域的Tony Chan教授合作了一个关于分析电路布局布线的联合项目。这拓宽了我对多层优化的认识。通过我们在CDSC中心合作,我从放射科的Denise Aberle、Alex Bui和William Hsu教授那里了解了医学成像的基础知识。最近,我与孙怡舟教授的合作加深了我对图神经网络和元学习的理解,这两项技术为EDA和硬件加速领域带来了新的方法。
我的博士生们也是我源源不断的知识和洞察力的来源。例如,谭伯琛是我第一位攻读量子计算方向博士学位的学生。他在每周的报告中不仅会更新他的研究进展,还会分享该领域的最新资讯和相关出版物,这些内容都让我获益匪浅。许多其他学生也会分享他们从各种来源找到的值得注意的读物,这种实验室内的知识分享和交流确保了我们始终处于研究前沿。
充分利用学术休假对扩展我的知识库和与其他研究人员的交流也非常有帮助。例如,在我最近的学术休假(2022-2023学年)上半学年在哈佛大学旁听了Mikhail Lukin教授的「量子信息物理学」研究生课程,然后在下半学年在瑞士联邦理工学院洛桑分校旁听了Wulfram Gerstner教授的「人工神经网络/强化学习」和Maria Brbic教授的「迁移学习和元学习」等课程。再次回到课堂成为一名学生是一个充实愉快的经历。我认为,在学术界工作最大的好处之一就是它为终身学习提供了持续不断的广泛机会。
问题四:作为电子设计自动化和下一代计算领域的杰出专家,您认为目前最引人入胜的趋势是什么?您能分享您对未来几年可能出现的新兴事物的远见卓识吗?
丛院士:预测未来是一件很困难的事情,我想在这里分享我目前的三个研究方向,它们反映了我对未来几年重要、有前景的研究课题的思考。
1)普惠集成电路设计 (Democratize Customizable Computing):
十几年来,经过CDSC 研究人员和许多来自学术界和工业界同行们的共同努力,证明了领域特定加速器 (DSA) 的效率。然而,设计定制化加速器仍然被认为只有电路设计人员能娴熟掌握。当前商业HLS工具可以从C/C++描述中生成 RTL 代码,但生成代码的质量在很大程度上取决于输入C/C++代码的编写方式。这通常需要有经验的硬件工程师手动调整并且在输入代码中插入许多 程序指示(pragma) 来获得所需的微架构。我们研究的目标是让每个注重性能的软件程序员或应用程序开发人员无需硬件设计知识也能创建自己的DSA。我们正在采取以下三种方法:
- 架构引导优化,例如脉动阵列 (systolic array) 的最优综合。
- 自动代码转换和自动pragma插入,我们结合精心设计的启发式方法和深度学习技术来使该过程自动化。
- 支持用于高层次领域特定语言 (DSL) 的自动综合,例如对TensorFlow或PyTorch描述直接综合生成对应深度学习应用的加速电路。
这项领域的研究成果总结发表于在2023年1月的《ACM Communications》杂志中一篇名为「Democratize Customizable Computing」的文章上。这篇文章也与斯坦福大学Mark Horowitz教授在2023年DAC会议主题演讲中阐述的愿景一致,他也强调了使应用程序开发人员参与集成电路和系统设计的重要性。
2)近数据计算与加速 (Near-Data Computing and Acceleration)
虽然已经存在一些用于优化芯片内互连延迟的解决方案,但芯片间甚至系统级的的数据移动仍然是一个关键瓶颈。从动态随机存储器(DRAM)或固态硬盘(SSD)将数据移动到CPU或GPU的延迟和功耗通常比在数据上执行计算操作高出几个数量级。为了解决这一挑战,我们的研究重点放在近内存和近存储加速上,使计算更接近数据。例如,我们最近的一项名为NeSSA (HotStorage’2023) 的工作就是在一块集成在SmartSSD上的FPG 进行智能数据选择,这样只有少部分数据会从SSD移动到用于机器学习训练的GPU或CPU中。这个领域为架构和算法的联合优化提供了充足的机会。
3)量子计算的设计自动化(Design Automation for Quantum Computing)
当晶体管尺寸接近1纳米甚至更小的时候,我们将进入另一个拐点,这可能标志着经典摩尔定律的终结。在此背景下,量子计算作为一种新的计算技术,在过去十年取得了长足的进步。例如,超导量子比特系统(superconducting qubit systems)、离子阱系统(trapped-ion systems) 以及最近的光镊阵列中性原子系统(neutral atoms trapped in optical tweezers arrays) 都显示出巨大的潜力。
IBM 计划建造一台 100,000个量子比特的量子处理器的计划凸显了扩展量子编译工具以匹配硬件发展需求的必要性。我们在2019年开始了量子计算研究,发现了现有量子计算布局综合工具存在着巨大的优化空间(以电路深度计约有5-45倍空间),因此我们开发了第一个最优且实用的量子布局综合编译器OLSQ。我们还将OLSQ应用于优化特定领域的量子计算架构,例如图最大割优化和量子卷积神经网络。这个领域交叉了EDA、计算机科学、电气工程和量子物理等诸多基础与前沿学科。我最近在 DAC’2023 上的邀请演讲/论文「Scaling Up Quantum Compilation」更加详细地讨论了这些挑战和机遇。
这些研究方向绝不是对未来的全面预测。我相信还有许多其他激动人心的研究机会。例如深度学习特别是大模型的快速进步可能会彻底改变EDA算法和方法。我们正致力于将深度学习与HLS结合起来,作为我们实现普惠可定制计算目标的一块重要拼图。
问题五:您拥有指导超过50位博士生和博士后的丰富经验。其中许多人已成为世界知名学者、研发经理和企业家。这彰显了您在学术界和工业界导师方面的重大影响。您能分享一下您培养博士生和博士后的方法吗?
丛院士:和学生紧密合作,是我学术生涯中最令人满足的部分之一。正如我之前提到的,师生之间是互相学习的关系,大多数研究项目都建立在共享的智慧和共同的愿景之上。此外,我也欢迎来自不同背景的学生加入团队,并在实验室会议上鼓励大家进行开放式讨论。我同样努力营造一个重视团队合作的环境。我们设立了年度最佳团队贡献奖来鼓励为团队做出贡献的学生。
最重要的是,我认为协助学生实现职业理想是我的根本责任之一。我每年都会和每位学生单独会面来讨论他们的职业规划。我鼓励学生在攻读博士学位期间参加1-2次行业实习,以便为他们未来选择留在学术界还是投身工业界做好充分的准备。对于那些对教授职位感兴趣的学生,我会尽力将他们介绍给相应领域的知名教授、资助机构的项目经理、以及潜在的行业合作伙伴等,帮助他们为学术生涯做好准备。另一方面,对于具有创业精神的学生,我会将他们与潜在的投资者和客户联系起来,为他们建立强大的人脉支持。
我坚信,学生优异的成就最终将是对我们科研和教学质量的最大肯定。
问题六:在您杰出的职业生涯中,您获得了许多享有盛誉的奖项和荣誉,其中包括IEEE和ACM会士、美国国家工程院院士、中国工程院外籍院士、美国国家发明家学院院士,以及最近获得的IEEE Robert Noyce奖章和EDAA成就奖。在这些杰出成就以及其他可能未提及的成就中,您认为哪项成就最为重要,它从您的角度来看该成就有何特别之处?您个人如何定义成功?
丛院士:您提到的许多奖项都令我倍感荣幸,能够与之前的获奖者并列名单,我深感谦逊。例如,IEEE Robert Noyce奖章的历届获奖者包括微电子领域的杰出领袖,例如台湾积体电路制造公司(TSMC)创始人兼前首席执行官张忠谋、Intel前首席执行官Craig Barrett、AMD首席执行官苏姿丰、Synopsys创始人兼首席执行官Aart De Geus,以及最近的IMEC首席执行官Luc Van Den Hove。他们对半导体行业的贡献和影响都是巨大的。此外,我也从EDAA成就奖的历届获奖者身上汲取了大量灵感,例如物理设计自动化领域的Kurt Antreich和Ernest Kuh,逻辑综合领域的Robert Bryton和Alberto Sangiovanni-Vincentelli,高层次综合领域的Hugo De Man、Daniel Gajski和Giovanni De Micheli。特别是,我非常荣幸追随我的博士导师,2017年EDAA奖得主刘炯朗教授的脚步也获得了这个奖项,我永远对刘教授充满感激。
然而,我最大的满足感来自于看到我们的研究成果在实践中产生的真正影响。1992年,我们开发了首个名为FlowMap的多项式复杂度深度最优FPGA映射算法后,然后看到它在短短几年内被所有主要的FPGA公司采用,这对我来说非常振奋。我记得1990年代中期 (当时AT&T正在销售ORCA FPGA) 参观贝尔实验室时,我问他们使用哪种技术映射算法。答案是PamWolf。我以为是一种我所不知道的新算法。然后,一位内部人士告诉我PamWolf实际上是FlowMap的字母倒序排列。因此,它是基于FlowMap的!另一个例子是我们对高层次综合(HLS)的贡献,始于2000年代初UCLA的xPilot项目,在随后成立的AutoESL 公司实现商业化,并于 2011 年被Xilinx收购。它构成了Vivado HLS和Vitis HLS工具的基础,该工具目前正在被全球成千上万的FPGA设计人员使用。几年前,我遇到了一位物理系教授。令我惊讶的是,他告诉我他们小组也使用Vivado HLS。他们将各种基于C/C++的算法直接编译到FPGA中,用于欧洲核子研究组织大型强子对撞机中实时处理以发现新粒子,这是我完全没想到的。看到我们的研究被来自完全不同领域的科学家用于推进人类知识的疆界,我感到十分欣慰。
此外,对于我们这些教授来说,另一个巨大的满足感来源就是看到学生们的蓬勃发展。我有幸与50多名博士生和博士后研究人员合作,其中许多人后来成为各自领域的领导者。例如,潘志刚教授已经在德克萨斯大学奥斯汀分校领导世界一流的EDA研究项目20周年,并且他将担任DAC'2024(EDA 领域旗舰会议)的技术程序主席。陈德铭教授是在HLS和硬件加速方面的工作而闻名的,他在伊利诺伊大学香槟分校领导多个大型跨学科研究。以在3D集成电路(3D IC)设计方面进行开创性研究而闻名的Sung-kyu Lim教授现在正在DARPA开展下一代微电子研究项目。张志汝教授在AutoESL成功被收购之后正在康奈尔大学领导一个大型的研究课题组,专注于HLS和高效机器学习,并担任了FPGA领域顶级会议 FPGA'2024的主席。
我的许多其他学生在亚马逊、Arista、彭博社、博通、Cadence、城堡投资、谷歌、IBM、KBC、Meta、英伟达等业界公司以及许多优秀的创业公司担任着重要的技术或管理职位。在过去三十年中,他们一直是我们在UCLA研究项目背后的强大动力。见证他们成功的职业生涯和领导职位,令我感到无比自豪和喜悦,同时也强调了学术界导师作用的深远影响。简而言之,我认为成功并非仅仅由个人荣誉来衡量,而是由个人工作带来的持久影响以及所指导和培养的人们的成就来衡量。
致谢
VAST Lab特别感谢参与此次采访翻译工作的下列学者:陈怡然教授(杜克大学)、高敏博士(谷歌)、周佩佩教授(匹兹堡大学)、吴昌教授(复旦大学)、王羽欣博士(AMD-Xilinx)、以及郭聪博士(杜克大学)。感谢他们的准确翻译和清晰表述,让原采访的的内涵得以完整地保留和传递。