蓝色的舞台上,正中间立着一块黑色的面板,面板上蓝色的扁圆形屏幕正在闪动,后面传出冷静而理性的女声。
而右侧的讲台上,一位西装革履的小哥正在聆听这个面板的“演讲”,时而动笔记录,时而面色凝重,时而嘴角露出邪魅一笑,看起来信心满满,胸有成竹。
这是 IBM 的 AI 与人类冠军辩手的对决,也是今年 Think 2019 大会的一个环节。
人机大战的一方是 IBM 的的 AI,Project Debater,那块黑色面板就是它在人间的载体。去年 6 月,它击败了 2016 以色列全国辩论冠军 Noa Ovadia,创下了 AI 在辩论方面击败人类的历史记录。
△ 左为 Project Debater,右为哈利什
另一方则是 2012 年欧洲辩论冠军哈利什·纳塔拉(Harish Natarajan),一位牛津本、剑桥硕的学霸,本科主修政治、哲学、经济(PPE)专业,因此他也是英国前首相卡梅伦的学弟;硕士则在研究哲学和国际关系;现在则是 AKE 咨询公司的经济风险主管。
谁胜谁败?由现场观众的选票决定。
这场辩论的规则比较简单,拿到辩题后,双方各有 15 分钟的时间进行准备,提出自己的论点和可以反驳对方的论据;
正式开始后,双方各有 4 分钟的时间进行开场立论,之后各有 4 分钟时间进行驳论,最后各有 2 分钟时间进行总结;
而场下的观众评审则是由湾区学校里的顶尖辩手和 100 多名记者组成,在辩论开始前和开始之后,观众评审们各进行一次投票,选出自己支持的观点,辩论后观点支持人数增加的一方获胜,另一方失败。
直击人机辩论
主持人送出一句“May the best debater win”的祝福,人类辩手出场,Project Debater“站”在台上静静等待。
他们今天的辩题,也算关乎人类的未来,起码关乎下一代:
We should subsidize preschool。
我们应该资助幼儿园。
正方:AI 辩手,反方:人类代表哈利什。
AI 认为,资助幼儿园这不仅仅是个经济问题,也是道德和政治问题。她的观点可以归结为三个方面:资助幼儿园能帮儿童摆脱贫穷、有助于后续的学业,甚至还能节约医疗开支、降低犯罪率。
从立论陈述到总结陈词,AI 都旁征博引:
为了说明高质量幼儿园能让孩子在之后的学业上表现更好,她引用了杜克大学的一项研究;
为了说明幼儿园和犯罪率之间的关系,她拿来新泽西州的案例,还用了好几次“大量研究表明”,列举了不少数据;最后的总结,还用上了人类作文要诀——名人名言。
人类代表哈利什也说,AI 提供了丰富的信息,列举了很多事实和数据。
而他的辩论风格和 AI 截然不同,人类辩手当然不能和一台电脑比拼查资料举例论证的能力。
哈利什选择抓住弱点反驳,再谈现实状况。他抓住的弱点,是 AI 反复论证的“拯救贫穷”,谈的显示状况,是政府的钱是有限的,投资了幼儿园就要耽误其他方面。
他说,投资幼儿园帮不了最贫穷的人,而是那些本来无论如何也要送孩子去幼儿园的中产。而“良好的幼儿园”带来的那些好处,一来只是推论,二来也不是穷人能享受得到的。
所以,还不如花在更实在的地方。
这场辩论充满反差感。AI 动之以情,讲人文关怀和人类尊严;人类晓之以理,谈政府要认清现实精打细算。
在驳论环节的最后,AI 甚至还学会了“升华”。她(对,官方给定义了性别)说:资助幼儿园事关 basic human decency,人类基本尊严。
在围观了整个过程的量子位看来,“人类基本尊严”由黑色面板背后的冷静女声说出来,现场观众大概不会有什么共鸣。AI 虽然打着感情牌,整体辩论风格却是充满英美老牌报刊的气息,如同托福高分作文一般,讲论点列论据。
而人类代表抑扬顿挫,有一丝丝网络论坛上流传的阴谋论味道:别听她的,能得到好处的,还是那群中产!
我们节选了开场环节的视频,来一起领略一下 AI 与人类的辩论:
最终,旁征博引谈人类尊严的 AI 还是输给了抓住漏洞狠狠攻击的人类。
辩论开始前,现场 79% 的观众支持投资幼儿园,而 20 分钟辩论过后的第二轮投票,支持者只剩下 62%。
人类冠军说服了 17% 的观众。
best debater,属于人类代表哈利什。
主持人在公布结果、恭喜人类辩手时,甚至一度口误,把“congratulations to him”说成了“to them”。
“带路党”哈利什
虽然取得了本场人机大战的胜利,哈利什却是个 AI 带路党。他认为在不久的将来,AI 的辩论水平总会比人强。
在赛后采访中,他说,AI 根据论点来引用论据、统计数据的能力让他印象深刻,Project Debater 如果和人类的能力结合起来,潜力巨大。
哈利什认为,相比象棋、围棋、星际 2 这些项目,机器想在辩论上赢过人类要难得多。在辩论赛中取胜,需要三个条件:
· 一,辩手需要巨大的信息量支持,并将这些信息组成支持己方观点的论点;
· 二,辩手必须将复杂的论点用清晰、有条理的方式讲出来;
· 三,辩手需要让观众认同这些论点至关重要。
也就是说,整个辩论的过程中,辩手需要谨慎的发言,表达情感,使用修辞,恰当举例。机器很容易在第一点中胜过人类,它可以方便的获取大量信息,并组成论点;但第二点和第三点对机器来说非常具有挑战性。
虽然难度很大,不过哈利什还是觉得未来会有 AI 在这三个方面都能超越人类。
AI 是怎么辩论的
辩论,需要收集信息、形成结构化论点、再用精确的语言表达出来,要清晰,要有说服力。
面对现场辩论中的陌生辩题,Project Debater 需要几分钟的时间来做准备。
整个过程,从搜寻资料开始。她会为了立论陈述从语料库中搜寻有用的短文本,找出几百条相关的片段。
下一步,就是根据这些片段,构建出强力、丰富的论据,来支撑要谈的观点。移除冗余信息,选择最强的语句和证据,根据主题把它们组织起来,构成叙述的基础。
几分钟时间准备好 4 分钟立论陈述之后,Project Debater 还要听取对手发言,准备驳论。
这个过程无论是对人类来说,还是对机器来说都很难。作为一个 AI,Project Debater 需要识别对手的论点和论据,寻找论点论据来回应它们。
和人类冠军面对面的 Project Debater,从 2014 年就开始为此准备了。
它自带一个庞大的知识库,从报纸杂志摘录了 100 亿个句子,还具备理解和生成语言的能力,还用知识图谱来寻找辩题背后隐含的悖论。
从项目开始到现在,Project Debater 团队发表了 30 多篇论文,还开放了一个数据集。
花这么长时间培养一个会辩论的 AI,有什么用?IBM 说,它可以帮网上各种论坛、评论区的辩论变得更文明更有营养,还能帮律师准备庭审资料,甚至能在金融领域辅助投资决策。
负责说话的那个女声,更是可以用到各种各样的领域。
离开爸爸保护的 AI 辩手
去年六月的那场辩论赛,人类高手输给了 Project Debater。
不过,当时的观众评审是一群自带利益相关体质的 IBM 研究员,也就是 Project Debater 的爸爸。
比赛进行了两场,第一场是 Project Debater 对战 2016 年以色列全国辩论冠军 Noa Ovadia,讨论“我们是否应当资助太空探索”,Project Debater 为正方,Noa Ovadia 为反方。
第二场则是 Project Debater 对战另一位以色列辩论专家 Dan Zafrir,讨论“我们是否应当更多的使用远程医疗”,依然是 Project Debater 正方,人类反方。
当时的两场辩论赛中,Project Debater 的语言表达相对生硬,但传递出的信息量更大,Project Debater 说服的观众更多一些——当然,负责投票的观众们是 Project Debater 的“爸爸”,毕竟是自家儿子,投票的时候也可能偏心了。