我们一起从考研说起。考研的重要程度,正在比肩高考。我给你说个数字:2021年全国高考考生是1078万人,2022年全国考研考生是457万人,也就是说,考研人数已经接近高考人数的一半。再来看录取率,2021年高考录取率为87%,而2022年考研录取率只有24%,考研的竞争激烈程度比高考要大得多。
目前,2022年考研笔试已经结束,分数还没有公布。很多考生反馈,今年的英语科目相对简单,政治科目比想象中难,但最难的是数学。有考生说,“70%的复习时间都给了数学,到头来还是当头一棒,感觉啥都不会”。还有人说,“感觉一年都白复习了,今年考完就觉得好像我没有学过数学”。可以说,在考研竞争中,谁能拿下高数,谁就能笑傲江湖。
其实,不光是普通人会觉得数学题很难,连人工智能在很长一段时间内都搞不定数学题。在一年以前,如果你给世界上最先进的人工智能出一道题,问它:五庄观里种了5棵人参果树,三千年一开花,三千年一结果,再三千年方得成熟。一万八千年后,一共结了多少个人参果?这个问题,人工智能大概率回答不出来。当时的人工智能解答这种文字表述的数学题,还处于小学生水平。
就在最近,人工智能突然开窍了,做数学题的能力直接秒杀理工科大学生。这是怎么回事呢?来看看新一期的麻省理工学院科技报告。
2022年1月4号,麻省理工学院等四所高校的联合研究团队,发布了一项最新研究成果:他们开发的神经网络程序,可以解答出微积分、线性代数等大学数学题。不管是要求计算数值,还是写方程式,或者画出函数图形,都是手到擒来,正确率达到了100%,真是学渣秒变学霸。要知道,在短短几个月前,人工智能解答类似的题,最高正确率不到10%。
说了这么多,人工智能到底是怎么开挂的?
我们先来想一下,为什么以前人工智能做不到?肯定不是因为算力不够,而是因为,解数学题不是直接算公式,而是需要你去理解文字,就像西游记中五庄观的人参果那道题一样。此外,有的题还需要联系上下文,并且包括了一些隐含条件。比如,一道概率论的题目,问:“在德州扑克游戏中,拿到两副对子的概率是多少?”这道题在别人看来很清楚,但是对于计算机来说,其实是有很多隐含条件的。比如,一副扑克有52张牌、4种花色;德州扑克的一手牌有5张等等。人工智能不知道这些隐含条件,就没法算题。
实现这个突破的核心,是一种新的翻译工具,名字叫做Codex。这是一个超大型的神经网络模型,经过了数以亿计的代码训练之后,就可以通过阅读人类的语言,理解语言想表达的意思,去掉与解题无关的多余信息,同时把语境背后的隐含条件补齐,最后用编程语言写出来。
比如那道德州扑克的题,“拿到两副对子的概率是多少?”Codex翻译出来是这样的,你感受一下:“一副牌有5张,从13组牌、每组4张、共52张牌中,随机抽取。抽到两副对子,要求5张牌中一共有3种牌,每种数量最多两张。请问抽到两副对子的概率。”
经过Codex的翻译之后,这道数学题就变成了一个很简单的编程问题,对人工智能来说是小菜一碟。
同学们,Codex可不光是能让人工智能开挂,它也可能让我这样的普通人开挂。假设,世界上还没有发明俄罗斯方块这款游戏,是我先想出了这个游戏规则,但我不会写代码。怎么办呢?我只需要对Codex说一段话,比如:“我想要一个游戏,各种由四个方块任意组成的形状,从屏幕上方掉下来,按方向键就可以控制它们的左右移动和加速下落,屏幕里面的一行如果填满了就把这行消除……”那么,Codex就会按照你的描述,用计算机语言重新生成一段能够顺利运行的游戏程序,并且真的可以在电脑平板上运行来玩。
在2021年8月,Codex的发布会上,就展示了用大概几百个字的文字描述,自动生成了类似飞机大战、躲砖块这样的游戏。是不是听起来特别神奇?我一个不会写代码的人,也能成为游戏设计师。
最后,看完这篇研文我也有一点感触。看似平淡无奇的人类语言,我们理解起来毫不费力,每日都在用而不知其中的内容容量,但是,强大的人工智能竟然需要经过数以亿计的代码训练,才能读懂语言背后的意思。语言学家乔姆斯基曾经说过一句话:“研究人类的语言,就是探索人类的本质,也就是探索迄今所知人类独有的心智特性。”