AI与人类之间无休止斗争的又一个战场:验证码

人工智能
钢铁是所有工业用品的总称,包括发电机和电池。当David与大型云计算公司交谈时,他们说他们正在打电话给制造商,说他们有一笔巨额订单。

「I'm not a robot」

几乎每一天,我们都要向网站的「看门人」证明自己是人类,而不是机器人,方法就是输入一个个验证码。

那么,问题来了,如果AI如此智能,为什么它不能识别一组交通信号灯呢?

emmm……实际上是可以的。

如今,人工智能非常强大,大多数验证码图像都可以轻松解析。

人工智能的出现开创了验证码绕过((captcha bypass)技术的新时代。神经网络和机器学习算法使系统能够从数据中学习、适应并克服传统验证码带来的挑战。

一度被认为是密不透风的验证码也在AI面前败下阵来。

AI甚至非常擅长模仿人类来骗过机器人检测器,比如,它会模仿我们「糟糕的」准确性,甚至模仿我们在犹豫点击哪个方框时的鼠标动作。

表面上看起来,这是验证码和AI之间的战争,实际上,这是人类和AI之间的博弈。

代顿大学计算机科学副教授Tam Nguyen近日为The Conversation撰写了一篇文章,探讨了人类、AI和验证码之间微妙复杂的关系。

验证码的工作原理

长期以来,网站和移动应用程序一直受到机器人的大规模攻击。

这些恶意机器人通过编程自动消耗大量计算资源、发布垃圾信息、收集网站数据,甚至注册和执行用户验证。

图片

2022年,所有互联网流量的近一半(47.4%)来自机器人,比上一年增加5.1%。人类流量的比例(52.6%)降至八年来的最低水平

在这种情况下,CAPTCHA(全称为「区分计算机和人类的全自动公共图灵测试」)应运而生,也就是我们现在所熟知的验证码。

作为一名计算机科学家,Tam Nguyen认为验证码是网站防止自动攻击、加强网络安全和改善用户体验的有效屏障,至少在短期内是这样。

验证码被设计为一些对人类来说很容易,但对计算机机器人来说却很难回答的问题或挑战。

它可分为四种类型:基于文本、基于图像、基于音频和基于行为。

图片图片

基于文本

自互联网诞生之初,基于文本的验证码就非常流行。

这种验证码类型要求用户阅读扭曲而复杂的文本图像,并将答案输入文本字段。

基于文本的验证码的一种变体是要求用户解决简单的数学问题,如「18+5」或「23-7」。

不过,由于深度学习人工智能的普及,最近先进的光学字符识别算法已经解决了这个问题。

具有讽刺意味的是,当文字被调整得更加失真、更加复杂时,真正的人类却无法提供正确的答案。

图片图片

《连线》曾发表文章,「我本周两次验证码测试都失败了,我还是人吗?」

基于音频

音频验证码会播放一段简短的音频片段,其中包含由人工或合成声音说出的一系列数字或字母,用户听完后会在提供的文本字段中输入这些数字或字母。

输入内容会与正确答案进行验证,以确定用户是否为人类。

与基于文本的验证码一样,音频验证码也会因背景噪音、音频质量差、失真严重和口音不熟悉等因素而难以被人类解读。

基于图像

引入基于图像的验证码是为了增加对机器人的挑战性。

用户必须从图像中识别特定对象,例如,选择包含交通信号灯的所有图像块。

这项任务利用了人类的视觉感知,而人类的视觉感知仍然优于大多数基于计算机视觉的机器人。

然而,这种类型的验证码在很多情况下也会让人感到困惑。

图片图片

「验证码总是让我对那些小边缘陷入纠结」

基于行为

基于行为的验证码会分析用户的行为,如鼠标移动和打字模式等。

流行的基于行为的验证码reCAPTCHA 要求用户勾选「I'm not a robot」框。

在此过程中,reCAPTCHA会分析鼠标的移动和点击,以区分人类和机器人。人类的行为通常变化较多,可预测性较低,而机器人的行为通常精确一致。

图片图片

AI vs. 人类

在人工智能与人类之间似乎无休止的争斗中,验证码是又一个战场。

最初,基于图像的验证码的想法是为了帮助训练AI执行书籍数字化任务时能更好地执行文本识别。

这个由Luis von Ahn(多邻国联合创始人)发明的创举,将扫描不清的单词作为验证码展示给人类,通过识别这些单词,我们教会了人工智能。

如今,人工智能已经变得越来越先进,可以利用深度学习和计算机视觉等现代技术来解决验证码难题。

例如,光学字符识别算法不断改进,使得基于文本的验证码变得不那么有效。先进的语音转文字技术可以绕过音频验证码。同样,经过大量图像数据集训练的人工智能模型也能以较高的准确率解决许多基于图像的验证码问题。

图片图片

论文地址:https://arxiv.org/pdf/2307.12108

在战场的另一端,验证码研究人员创造了更复杂的验证码技术。

例如,reCAPTCHA可以评估用户的交互行为,并计算出他们是人类的可能性。

具有讽刺意味的是,人类正在帮助人工智能解决复杂的验证码问题。

例如,点击农场(click farms)雇用大量低薪工人点击广告,包括社交媒体帖子、关注账户、撰写虚假评论,甚至解决验证码问题。

越南社交媒体点击农场越南社交媒体点击农场

他们的工作就是帮助人工智能系统表现得像人类一样,从而击败验证码和其他防欺诈技术。

验证码的未来

安全措施与寻求规避安全措施之间的永久军备竞赛促进了不断的创新。

随着人工智能的不断发展,网络安全专家和那些寻求突破数字障碍的人所采用的方法也会不断发展。

可以预见,验证码的未来将受到人工智能不断进步的影响。

传统的验证码方法正在失去效力,因此未来的验证码系统可能会更加注重分析用户行为,例如人们如何与网站互动,从而使机器人更难模仿这种行为。

网站可能会转向使用生物识别验证码,如面部识别或指纹扫描,但这些都会引发隐私问题。

所以不要指望验证码会很快消失,宾夕法尼亚州立大学信息科学与技术教授Ting Wang预测,它们将「继续作为一种廉价、与平台无关的通用验证解决方案而存在」。

让这场矛盾更加复杂的是,随着人工智能成为验证码绕过的重要参与者,它在加强安全方面也发挥着至关重要的作用。

人工智能驱动的安全解决方案正在兴起,利用预测分析和异常检测来识别和阻止潜在威胁。在线安全的未来,可能会见证AI驱动的绕过尝试和AI驱动的防御之间的共生关系。

无论如何,用户便利性和强大的安全措施之间的微妙平衡仍然是焦点,敦促验证码设计和人工智能驱动的防御领域不断创新。

总之,未来的验证码可能会与人工智能系统一起实时工作,不断适应和发展,以领先于自动攻击。

参考资料:

https://techxplore.com/news/2024-08-captchas-struggle-real-humans-fake.html

https://www.sciencefocus.com/future-technology/ai-vs-captcha

https://medium.com/@media.tech/how-artificial-intelligence-is-being-used-to-bypass-captcha-205a08519d9d


责任编辑:武晓燕 来源: 新智元
相关推荐

2012-03-07 11:30:07

常小兵宽带宽带资费

2020-10-31 21:59:37

Python列表开发

2020-02-18 20:28:23

AI人工智能

2017-07-26 10:57:29

程序员加班原因

2021-12-25 19:19:18

AndroidAndroid 13安卓

2009-10-30 08:44:37

Windows 7系统升级重启

2013-05-29 10:10:34

游戏设计

2024-04-01 09:00:00

AI智能体

2021-08-26 05:25:56

机器人人工智能科技

2022-02-06 20:55:39

jsEsbuild项目

2020-11-16 07:28:53

验证码

2023-05-14 23:38:43

Glarity用户视频

2019-09-14 22:05:19

人脸识别地铁AI

2019-06-11 12:16:37

新零售互联网巨头

2022-11-30 10:59:20

2014-10-11 09:15:36

2012-04-12 09:53:02

2020-01-06 13:11:30

技术工具

2017-08-31 10:32:35

交付技术

2021-12-29 18:18:59

开源MedusaShopify
点赞
收藏

51CTO技术栈公众号