2014年4月,在计算机视觉领域刮起了***的创业旋风之前,Nature(《自然》),Science(《科 学》),Discover(《发现》)等***科学杂志的新闻资讯中,几乎同时出现了一项计算机视觉领域突破性的研究成果:名为“高斯脸 (GaussianFace)”的算法使计算机的人脸识别准确率***次超越了人类。更准确地说,在著名的人脸识别国际测评平台 LFW 上,使用了“高斯脸”算法的计算机以98.52%的识别率***击败了人眼97.52%的识别率。这项算法的发明人正是陆超超,一名24岁的90后。
“高斯脸”算法发明人陆超超凭借此项卓越的研究成果,获得国际人工智能领域权威学术会议AAAI的“***学生论文奖”之后,选择加入了一家锐气十足的创 业团队——Linkface,作为新的起点。作为这支年轻团队的老练研究员中的一位,陆超超身上传奇的故事不亚于公司任何一位创始人。
陆超超选择了“贝叶斯”,“贝叶斯”也选择了他
在计算机视觉研究者陆超超面前,进行人脸识别的算法研究,摆着两条路:当下热度非凡的“深度学习”方法和“更加智能”的“贝叶斯”方法。
在计算机视觉界,选择“贝叶斯”方法进行研究意味着放弃了通过训练大量数据得出结果的坦途:深度学习通过“神经网络”来完成,研究者需要设计该网络有多 少层、多少节点,形成训练模型后加数据进行训练,效果不佳则需要追加数据量或者更改网络结构;而贝叶斯非参数方法只需要输入数据、有几个简单的假设,便可 以自动生成模型。同期,Facebook发表的深度学习算法Deepface使用了400万个数据进行训练,准确率为97.25%;而“高斯脸”的训练数 据仅2万余。这就好比,一个聪明的学生通过2万道练习题,却掌握了别人通过400万道练习题才能掌握的方法,而且考出了更好的成绩。
陆 超超相信,他所使用的进行人脸识别的方法更“智能”,也将会是深度学习未来发展的方向。统计学习理论之父 Vladimir Vapnik 曾说,“深度学习是以蛮力取胜,大数据时代经验主义的胜利”,小孩不需要几百万的数据样本以完成学习,也许真正的人工智能只需要数百样本,“高斯脸”算法 更贴近自然界中关于学习的基本原理。
从1990年至2014年,计算机视觉的算法虽层出迭代,但表现依然逊色于人类肉眼。在陆超超所专注的人工智能分支——计算机视觉领域中,许多科学家做着“让计算机看懂世界”的工作,让计算机学会“认人”的本领、能进行“人脸识别”是其中重要的研究课题之一。
陆超超和他的“高斯脸”给计算机视觉发展史打上了自己和“贝叶斯”的烙印;也成为人工智能史上继IBM深蓝战胜国际象棋冠军、IBM沃森打败人类冠军后 的又一座里程碑。在人脸识别领域,陆超超是***个把高斯过程方法化的学者,既为高斯过程的未来应用打开了“新世界的大门”,也为人工智能领域的“人脸识 别”课题找出了一种“更加智能”的解决方案。
在这个时代,“贝叶斯”选择了陆超超作为人脸识别领域***的代言人,而这一切对他来说似乎只是一个开始。
创业真的是跟风?他想用自己的方式打造***
陆超超成长于中国苏州太湖上的***大岛西山岛,从南京大学本科毕业后来到了有 “计算机视觉界的黄埔军校”美誉的香港中文大学多媒体实验室,跟随汤晓鸥教授攻读硕士学位。
打开陆超超所在的多媒体实验室的官方网站,他的照片被列在研究生一栏,位置并不那么显眼。网页上,实验室的学生斩获获奖论文无数,众多毕业生已在***科研院所和微软、谷歌、以及BAT等互联网巨头企业担任要职,选择自主创业的学生也不在少数。
陆超超与实验室缘起于几年前,在北京听的一场深度学习主题讲座彻底改变了他的求学轨迹,主讲人汤晓鸥教授随后成为了陆超超研究生的导师。“在实验室有很 自由的研究环境,可以放手做自己喜欢的领域研究”陆超超说。在这段时间里,陆超超在人脸识别领域开创了属于自己的流派,实现了站在巨人的肩膀上做一些不一 样的事情的梦想。
同样是在2014年,计算机视觉领域刮起了***的创业旋风,在这个风口上,人们不单想站在巨人的肩膀上,他们的目标是正面挑战巨人。
陆超超选择了Linkface,一家话题性十足的人脸识别创业公司,作为新的起点。创业伊始,Linkface 的“女性创始团队”让充满着雄性荷尔蒙的创业圈眼前一亮。随后,Linkface 则用技术实力开始向市场和业界展示着自己的肌肉:FDDB人脸检测公开测试世界***、300-W Benchmark 准确率世界***、LFW人脸识别准确率达99.5%以上的成绩;公司的技术产品正在与京东、科大讯飞(002230,股吧)、中国银联、华为、英伟达等行业巨头进行着深度合作。
人们或许早已厌倦了退学创业者获得成功的故事,就在 Linkface 不断取得研究领域的突破并斩获大客户之时,陆超超用一种非凡的方式继续自己的创业之路:在公司的支持下,他决定在2015年底跟随剑桥大学的贝叶斯研究的 权威教授 Zoubin Ghahramani 继续追寻让计算机视觉“更加智能”的可能性。陆超超一直都有一个心愿:通过他们的努力,有一天贝叶斯非参方法将在另一项人工智能***竞赛Image- Net上超越所有深度学习的方法,独占鳌头。
其实,就在陆超超公布“高斯脸”算法一个月后,同实验室的师兄孙祎的基于深度学习的 DeepID 算法以99.15%的准确率将其超越。对此,陆超超很淡然,并没有感觉到惊讶,因为在他看来真正的“智能”时代不能囿于数据的优劣,他表示用贝叶斯非参的 理念可以帮助重新设计深度学习的模型。陆超超认为深度学习的***是贝叶斯非参(能够自己生成模型),“一切让数学自己去说话,完全摆脱人类干预”,研究的 趋势是让两种方法达到***融合。
从西山岛到香港岛,再到相隔更远的大不列颠岛,陆超超在三岛之上的跳跃给中国计算机视觉创业圈展示了一 个不一样的走法。用贝叶斯非参的理念帮助重新设计深度学习模型,进行这项两种方法“殊途同归,强强联合”的深入研究,将会带给计算机视觉界更多的惊喜,期 待着陆超超在剑桥的研究能为太平洋(601099,股吧)东岸的中国带来新鲜力量。