继谷歌宣布人工智能项目AlphaGo实现突破性研究——计算机程序首次击败专业棋手之后, 谷歌DeepMind公布了将与过去十年最佳围棋手李世石之间的终极挑战的详细情况。3月9日至3月15日,AlphaGo将在韩国首尔与李世石进行5场挑战赛。比赛完全平等,获胜者将得到一百万美元奖金。
今天下午,谷歌人工智能AlphaGo与韩国棋手李世石的第一场比赛结束,AlphaGo获得今日比赛的胜利。双方在较量3个半小时后,李世石宣布认输。今日比赛结束后,双方还将分别在10日、12日、13日、15日的北京时间中午12点进行剩余4场比赛。
李世石赛后的表情,求此时人类棋王的阴影面积
AlphaGo开发者DeepMind公司在今年1月的学术杂志《Nature》刊登封面文章,展示了围棋人工智能领域突破性进展的详细情况。这次对弈中,坐在李世石对面正是《Nature》封面文章作者之一黄士杰(Aja Huang),他本人来代替AlphaGo在棋盘上落子。AlphaGo一方的旗帜是英国国旗,因为这次参赛的谷歌围棋程序AlphaGo来自英国人工智能公司DeepMind。
谷歌AlphaGo在第一次与世界顶尖围棋手的较量中取得胜利,这是人工智能发展史上重要的里程碑,代表人工智能已经能在诸如围棋等高度复杂的项目中发挥出超过人类的作用。
谷歌的AlphaGo有多强大
传统的人工智能方法是将所有可能的走法构建成一棵搜索树 ,但这种方法对围棋并不适用。此次谷歌推出的AlphaGo,将高级搜索树与深度神经网络结合在一起。这些神经网络通过12个处理层传递对棋盘的描述,处理层则包含数百万个类似于神经的连接点。
其中一个神经网络“决策网络”(policy network)负责选择下一步走法,另一个神经网络“值网络”(“value network)则预测比赛胜利方。谷歌方面用人类围棋高手的三千万步围棋走法训练神经网络,与此同时,AlphaGo也自行研究新战略,在它的神经网络之间运行了数千局围棋,利用反复试验调整连接点,这个流程也称为巩固学习(reinforcement learning),通过广泛使用Google云平台,完成了大量研究工作。
AlphaGo在与人的对弈中用了“两个大脑”来解决问题:“决策网络”和“值网络”。通俗来说就是,一个大脑用来决策当前应该如何落子,另一个大脑来预测比赛最终的胜利方。
谷歌希望能把这套人工智能算法用于灾害预测、风险控制、医疗健康和机器人等复杂领域。也就是说谷歌的目的还是为了更好的服务人类,没有任何恶意。DeepMind(AlphaGo的研究公司)创始人哈萨比斯说:公众对人工智能的警示掩盖了人工智能带来的帮助。距离人脑水平的人工智能仍然相当遥远,可能还需要几十年。
在昨天的赛前发布会上,谷歌董事长施密特表示,输赢都是人类的胜利。因为正是人类的努力才让人工智能有了现在的突破。
人工智能在安全领域也表现不俗
今年八月一场名为Darpa’s Cyber Grand Challenge网络挑战赛将举行,参加决赛的七支团队必须利用对手漏洞进行攻击的同时,还要发现并自动修复自身漏洞、维护性能与功能正常。与其他“夺旗”竞赛不同, 这是世界第一个完全由计算机软件主导的黑客比赛。
获胜者最后会赢得200万美元大奖,Darpa其实就是美国国防部高级研究计划局,不怪人家就是财大气粗!
机器黑客:自动挖洞、打补丁
加州大学圣芭芭拉分校计算机科学教授Giovanni Vigna是黑客团队“Shellphish”的创始人,他们建立了一个叫做“Mechanical Phish”(机械钓鱼)的系统将参加本次比赛。
Vigna在2016年美国RSA安全大会上表示:
“完全自动化的hacking系统是我们最终的边界。人类能发现漏洞,却没办法对数以百万计的项目进行分析。”
现实中的黑客并不如电影描述的那么“性感”,他说:
“黑客通常只是一堆围在桌边的人,很疲惫却仍在笔记本上敲击键盘。而我们之所以当黑客,要么是因为我们想攻击别人,要么是想找出漏洞,或者仅仅是因为好玩。”
“机器黑客”在保护网络、快速识别、系统补丁等过程表现出色,从而避免了漏洞的利用、数据被盗或网络服务遭到攻击的情况。
人工智能快速通关“超级玛丽”
除了Cyber Grand Challenge之外,其他组织也已经开始将人工智能运用于hacking机器中。
Konstantinos Karagiannis利用神经网络(模拟人类大脑学习和解决问题)建立了一个hacking系统。据他介绍,这个名为MarI/O的人工智能程序可以在没有任何先验知识的情况下,只经过34次尝试便通关了“超级玛丽”。最初,它只有几个简单的参数设置,经过几次不同尝试之后它就“了解”到应该怎么玩,它“学会了”。
视频
Karagiannis说:
“采用了AI技术的安全扫描器可以识别复杂的漏洞,那些具有极具创意的手法是人们不曾想到过的。它可以采用非常低端硬件,价值一千美金的GPU(图形处理单元,通常用在游戏当中)就可以超过一台十年前的超级计算机。”
Karagiannis希望能在今年夏天演示这个POC。
每个硬币都有另一面
尽管“机器黑客”能为安全专家的弹药库提供颇具杀伤力的武器,但是更大的风险在于这些武器也可能落入错误的人手中。Karagiannis告诉卫报,攻击者如果在一年内使用了这些技术,他并不会感到惊讶。
HackerOne安全公司联合创始人Alex Rice同意这一观点,他认为任何可以用来发现漏洞的防御手段都可能被罪犯利用——技术最终都会成为一把双刃剑。
尽管如此,Rice认为自动化安全措施的兴起是一件好事:
“人人都在努力跟上趋势。几乎所有组织都经历过网络攻击,这关系到生死存亡,显然之前我们所做的一切都是失败的。而最好的解决办法就是将人类与机器的技能加以结合,人类最擅长的东西目前我们还没发现。而即使未来我们拥有了有感知的机器时,它们依然要接受人类的指挥。”