中国培养的人工智能研究人员和美国一样多,但在机器学习等关键领域却落后了,这究竟是为什么呢?政府希望能够补齐这一短板。
俯瞰北京,在一座坐落于繁忙十字路口旁的低层建筑里,文继荣——一位戴着细框眼镜、留着一头乌黑秀发的中年科学家,兴奋地描述着一个可能推动全球人工智能(AI)最热门领域之一的项目。
文继荣教授领导着北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI)的一个团队,这是一个由政府资助的研究实验室,其正在测试一种功能强大的新语言算法——类似于GPT-3,GPT-3是OpenAI的研究人员在去年6月份透露的一个程序,它可以消化大量的文本内容,并能生成非常连贯、自由的语言。“这是一个极为庞大的项目。”他笑着说道:“它需要大量的计算基础设施和资金。”
自从北京人民大学的文继荣教授,被聘请到北京智源人工智能研究院(BAAI)兼职工作后,他希望创造出一种比GPT-3更聪明的算法。他计划将机器学习与事实数据库结合起来,并向算法输入图像和视频以及文字,希望创造一个对物理世界有更丰富理解的算法——例如,“猫”和“皮毛”这两个词不仅仅是经常出现在同一个句子里,而且在视觉上也彼此相互关联。包括OpenAI在内的其他顶级AI实验室也在做类似的工作。
吸引文继荣教授来到BAAI的一个原因是——其令人极为印象深刻的计算资源。他对此解释道:"北京智源人工智能研究院(BAAI)得到了政府的大力支持,并拥有着强大的数据和计算能力。”
他所创造的语言模型是BAAI众多项目中的一个,旨在从根本上推进人工智能的发展进步,并反应了中国科技的新时代。尽管国内的技术崛起仍有一条极为漫长的路程需走,但到目前为止,我们主要擅长从某些专一领域中获取创新成果,并以新的方式进行部署。这一点——在人工智能领域尤其明显,从所颁布的一系列人工智能国家战略发展规划中可以看出,该领域对我们中国成为真正的超级大国的愿望至关重要。
从长远来看,北京智源人工智能研究院(BAAI)的一些突破,可能会让国内的各个科技领域直接受益。文继荣教授表示,该新型语言系统可以作为一个智能助手,帮助每一个公民在线办理各种公共业务,比如获得签证、驾驶执照或营业执照。这一个智能助手可以引导公民完成繁琐的手续,而不是像往常一样花上几天时间填写文件和排队等候。 这既解决了繁文缛节的手续给我们所带来的麻烦,又高效严谨地核实了每个填写人的信息——可谓是一种完美的双赢。该项工作的项目负责人、此前在国内最大搜索公司百度担任工程师的刘占亮表示:他的团队已经为北京市机动车辆管理所打造了一个原型。他表示:“这真的是一个非常艰巨的挑战。”
当然,我们还可以在其他方面受益。比如,现今在社交媒体上铺天盖地的谣言评论或一些非法活动的电话记录日益猖獗,该更复杂的人工智能语言系统可能被证明对搜索这些不当行为极为有用。而且,我们的网络社会已经接受了将人工智能作为一种辅助工具,包括用于犯罪搜查和审查。从这一方面来看,AI系统的使用对于我们的社会治安极为有益,但是从另一方面来看,它也是供任何商业化或个人应用的,这也需提防其的不当使用。这也是在其商业化方面需严格管理的事件。
正因如此,包括前段时间的人脸识别安全性问题,让我们对人工智能的合理利用持谨慎态度。北京智源人工智能研究院(BAAI)的几个项目旨在为人工智能的商业应用设置警戒线,以抵御道德挑战,遏制大型科技公司的滥用。
"每一个国家都试图在这个问题上取得进展,以确保其适当地控制,我认为这实际上并没有被证明是完全直接的。"奈杰尔·英克斯特(Nigel Inkster)说,他是《大脱钩》(The Great Decoupling)一书的作者,这本新书讲述了中美关系的历史演变。
一个雄心勃勃的人工智能(AI)计划
在2017年,国家发布的一项全面战略规划中明确了对人工智能的雄心。其为人工智能研究人员明确了 "至2025年取得根本性突破 "的宏观目标,并呼吁在2030年让我国成为 "世界主要创新中心"。
在一年后,北京智源人工智能研究院(BAAI)位于中关村成立。中关村,这一创新中心社区为其提供了得天独厚的资源与环境,比如搜索引擎公司百度、搜狗、PC制造商联想(Lenovo),还有众多电子产品店铺。
近年来,这些电子产品店铺开始逐渐消失,数十家初创科技公司如雨后春笋般涌现,许多公司专注于为人工智能寻找利润丰厚的应用前景——如制造业、机器人、物流、教育、金融等领域。
BAAI将于今年晚些时候搬入离现在办公室不远的新大楼。这个地点既具有象征意义,也极具实用性,因为其步行即可到达中国两所最负盛名的大学——清华大学和北京大学,以及去年政府为吸引本土微芯片企业而开放的中关村集成电路设计园。
由于疫情原因,国内外的访问交流受到了一定的限制。但这也不妨碍国外学者和媒体们对其的关注热情。威尔·奈特(Will Knight)是一名资深AI领域编辑,在访谈中谈到其对一些在BAAI工作的学者们印象颇深。并曾通过Zoom与该研究所的研究人员交谈,一位行政助理通过微信视频带其参观。他回忆道:“透过小小的屏幕,我看到工程师和后勤人员坐在一间开放式的办公室里,周围是郁郁葱葱的盆栽植物。接待处的墙上挂着牌匾,标明了研究所的各个部门,包括智能信息处理和人脸结构分析。另外还有一个大牌子上写着指导该中心的宗旨:学术思想、基础理论、顶尖人才、企业创新、发展政策。“
BAAI的一个小组正在探索支撑机器学习算法的数学原理,这一努力可能有助于改进现今的机器学习算法。另一个小组则专注于从神经科学中汲取见解,以构建更好的人工智能(AI)程序。当今最著名的机器学习方法——深度学习,其灵感大致来自于人类大脑中神经元和突触从输入中学习的方式。更好地理解动物和人类认知背后的生物过程,可能会带来新一代更智能的机器。该研究所的第三个小组专注于设计和开发微芯片,以更有效地运行人工智能应用程序。
“创新的本质就是不确定的,也许没有什么事物能比人工智能更具有不确定性。”——诺姆·尤特曼(Noam Yuchtman),伦敦经济学院
许多隶属于BAAI的研究人员正在进行前沿领域研究。其中之一是研究如何使深度学习算法更加高效和紧凑。另一项研究是"神经形态 "计算机芯片,它可以通过镜像生物过程从根本上改变计算机的工作方式。
中国AI人才培养的窘境:不在于培养的人才数量不足,而是大多最终流向美国
从目前来看,中国确实拥有着不少顶尖的人工智能学术人才,但与美国、加拿大或一些欧洲国家相比,国内的顶尖专家仍然较少(指留在国内工作的专家)。保尔森研究所(Paulson Institute)于去年6月发布的一项关于人工智能研究论文的研究发现,中国和美国每年培养的人工智能(AI)研究人员数量大致相同,但其中绝大多数人最终都在美国工作。(这很好地说明了未来我们培养高精尖人才时,不单是培养人数这一简单问题,更在于如何改变培养人才的策略方向)
在特朗普政府期间,其利用我们无法制造最先进的微芯片这一空窗期而实施制裁后,这个问题最近变得更加紧迫。美国最明显的目标是华为(Huawei),它指控华为存在所谓的不正当输送数据业务,并切断了其制造高端智能手机所需芯片的供应。2019年,美国扩大了对中国的制裁,禁止美国公司与几家人工智能公司进行生意往来,并无端指责其提供了所谓的监控技术。如今2021年,拜登总统可能会采取与特朗普不同的做法,但他不太可能忽视中国的技术崛起对其所带来的威胁。
北京智源人工智能研究院(BAAI)的首任院长黄铁军教授,在会谈中停顿了很长时间后,极为谨慎、严谨地表达了其对此的观点和想法。他认为,该研究所是以西方机构为蓝本,这些机构将不同的学科结合在一起,从而推动中国人工智能(AI)的发展。接着他解释道,尽管中美关系困难重重,但研究机构与这类机构建立联系至关重要。其已派出研究人员访问了加拿大的蒙特利尔学习算法研究所 (MILA)和英国的阿兰·图灵研究所(Alan Turing Institute),这是世界上两个顶级的人工智能专业研究中心。包括普林斯顿大学(Princeton)和加州大学伯克利分校(UC Berkeley)等美国机构的人工智能科学家担任该研究所的咨询委员会成员。
中国并不是唯一一个投资人工智能的国家。美国国防高级研究计划局也已开始部署具有潜在军事用途的研究。然而,许多西方国家对中国如何利用技术来促进我们的潜在利益和价值持谨慎态度——例如,将数字技术与 "一带一路 "倡议联系在一起,该倡议旨在建立与邻国的经济和基础设施的纽带。由于与这一因素有明确的联系,不难看出BAAI的工作有具有广泛的议程。
BAAI的研究或许可以作为软实力的工具,例如通过技术标准。许多在华留学的西方学生也十分明白,政府制定标准的最终成果是一种有利于国内企业、塑造人们对一种技术的认知和规范的方式。然而,每当这些信息传达到西方媒体后,就变得完全不一致了。中国企业一直在积极为先进的5G移动网络制定技术标准。BAAI的一个研究小组专注于人工智能的技术标准,并在去年7月发布了机器学习文章的拟议符号。
一些西方研究人员表示,中国正在做的一些事情并不罕见。剑桥大学(Cambridge University)莱弗休姆智能未来中心(Leverhulme Center for the Future of Intelligence)研究员丹尼特·加尔(Danit Gal)专门研究人工智能伦理,此前曾担任联合国技术顾问。在北京智源人工智能研究院(BAAI)开办时她正在北京大学学习,并参加了其中几次会议。她表示,当研究所在做认真地进行研究时,其他国家却在关注这些争议是十分不公平的。"中国正在做的事情,不论其真实与否,并不是单单一个国家所独有的。"她接着说到:"我来自以色列,以色列的监控和边境事件是由微软提供支持的。" (微软投资了以色列AnyVision公司,该公司提供在约旦河西岸检查站使用的面部识别软件,但该公司在2020年3月表示,将剥离其股份。)
黄铁军教授和BAAI的其他研究人员表示,他们将会进一步与更多国际研究人员进行交流,在学习探讨新技术的同时,也可以此间接推广中国的新兴技术。黄铁军教授在论坛中提到:"BAAI是一个共享平台,把来自不同国家、有着不同答案、不同背景、不同观点的人聚集在一起,这样他们就可以相互交谈、相互了解。"
胡佛研究所(Hoover Institution)专注于中国事务的格伦•蒂夫特(Glenn Tiffert)教授表示,这一种参与是有意义的,但重要的是要了解更广泛的背景。“我绝对不赞成脱钩这一现象,他们是最为可敬的人,是有诚信的人。”当他在谈到该研究所的工作人员和研究人员时表示:“但最重要的是——该研究所的所有成果与努力,幕后都一直有政府和资金默默地支持和保障。这一点我们西方国家很多机构是做不到的。”
对于数据使用的反思:科技公司是否应该有如此之大的使用权?
2019年夏天,在疫情爆发前,威尔·奈特(Will Knight)曾专门拜访了北京自动化研究所的一位研究员——曾毅教授,作为一位自动化研究所的新面孔,他也是BAAI人工智能伦理与安全研究中心的主任。他的团队代表北京市政府制作了一份涵盖人工智能使用的道德规范。该准则目前是自愿性的,其表明:人工智能不应该存在歧视;不应以构成安全风险的方式使用;如果人工智能系统行为不当,最终用户可以选择退出。
曾毅教授还给这位编辑展示了一张图,上面有47条由不同国家的公司和政府制定的AI道德规范。他表示,他的团队希望与来自世界各地的研究人员讨论AI偏见和隐私保护等问题,以此更好地解决一些关于信息泄露以及滥用问题。
然而,值得注意的是,一味地注重AI的发展进步,以至于让其在任何领域进行无限扩张应用是不可取的。但是,另一个极端是,像某些西方机构过度纠结于人工智能算法的伦理道德问题,最终陷入为了定义而定义的死循环中,这也只会让技术的发展止步不前,而违背了让AI更好发展的初衷。人工智能的发展必然是在这两个界限之间螺旋上升的,这一种否定与自我否定的过程才是一种良性的循环。
去年11月,阿里巴巴旗下的金融科技公司——蚂蚁金服(Ant Group),其在香港和上海的IPO上市计划遭到暂缓。并且监管部门将调查阿里巴巴可能存在的反垄断滥用行为。《大脱钩》(The Great Decoupling)一书的作者英克斯特(Inkster)表示,政府正在 "不遗余力地提醒国内的私营企业,极度扩张与膨胀是一种极为不可取的行为"。
目前,国内正在起草一项重要的新隐私法,其将严格管理公司可以收集和使用的数据——这将在一定程度上保护我们的个人信息以免泄露,同时也完善了国家为执法和审查而搜索数据的监管体系。BAAI现正在进行的一些项目工作,这很好地反映了这一个新时代的来临。为了应对这场疫情,BAAI的一个团队开发了一个蓝牙Covid - 19接触者追踪应用程序,其可以在不收集身份信息的情况下提醒人们可能的密切接触。BAAI的发言人表示,该APP已经在中关村周边的几个办公室进行了测试,目前来看效果不错。
伦敦政治经济学院(London School of Economics)教授诺姆·尤特曼(Noam Yuchtman)发表的一篇论文中,其利用了来自中国的证据表明,人工智能自上而下的干预所获得的好处是独一无二的,因为算法对数据和计算机能力的需求极为庞大,而政府可以为其保障充足的数据量和可靠的资金支持。但他补充道,这种快速发展和不可预测的技术也可能给政府带来一些潜在问题(包括如何合理使用和个人信息安全问题)。正如其文中所写道的那样:"创新的本质就是不确定的,也许没有什么事物是比人工智能更具有不确定性。