恶意爬虫正在搞垮你的网站,这届“网络流氓”真不好对付

安全
著名调查机构Aberdeen Group在2019年做过一次调查,真实访客的流量,只占到全网流量的62.8%,其余的37.2%是机器人(Bot)刷出来的流量。

在整个互联网中,真实访客的流量有多少?90%?70%?还是50%?

著名调查机构Aberdeen Group在2019年做过一次调查,真实访客的流量,只占到全网流量的62.8%,其余的37.2%是机器人(Bot)刷出来的流量。

恶意Bot

在这些Bot流量中,恶意Bot占比高达24.1%,早在2015年,这一数据仅为18.6%。短短5年时间里,恶意Bot占比上升6个百分点,这个比例意味着什么?

如果企业经营一家网站,可能意味着,24%的用户是假的;策划一个线上活动,其中24%的奖品,会被Bot刷走;24%的服务器资源会被浪费……

[[383314]]

对于一个正在成长的企业而言,是相当致命的。恶意Bot能在各个方面对企业正常业务产生广泛影响。

(1) 恶意注册

2020年底,微信发布公告,封禁涉嫌恶意注册的300万个账号,因恶意注册被封禁的账号,已经超过620万个。

如此庞大的注册数量,将导致企业无法获得真实的用户数据,从而在做出决策时,产生偏差。短时间内大量注册,也会给服务器带来压力。恶意注册的账号如果在市场上流通,还会给企业带来政策法规方面的风险。

(2) 非法登录

2018年,一名英国男子对17个网站发起暴力破解,窃取超过16.5万条用户信息,并将它们打包在暗网进行售卖。

通过Bot进行撞库和暴力破解,攻击者可以非法获取账号敏感信息,例如姓名、手机号等等,可以将这些信息打包贩卖。而且还可以盗取账号资产,或者权限,用于非法目的。

(3) 非法抓取

2019年,今日头条因为大量抓取百度搜索结果,被百度以不正当竞争为由起诉,索赔9000万元。

非法抓取大案不止,小案不断,因为爬虫抓取他人信息的案件时有发生。站在企业角度上看,被恶意爬虫光顾,业务核心数据被抓取,对手轻易获取这些信息,会导致网站竞争力下降。

(4) 恶意刷票

大量恶意刷票抢票Bot,会让正常用户无法购买所需的票。竞争对手通过恶意Bot抢票,再退票,让企业业务无法开展,造成损失。

[[383315]]

(5) 活动作弊

无论企业想举办什么线上活动,恶意Bot都是一大威胁。通常情况下,企业都会设置一些简单的防刷策略,但无法完全避免被羊毛党薅羊毛。像零元购、秒杀、抢红包、优惠券,被羊毛党薅走的事情屡见不鲜。

[[383316]]

防御恶意Bot

既然恶意Bot会严重影响企业正常业务,那么该怎么防御呢?一般可采取六种方法。

(1) 限制源IP

直接限制源IP的请求速度,简单粗暴。这种方式有一定风险,例如在秒杀、抢购活动中,瞬间请求激增,如果源IP请求被限制,误报率很高。比起恶意Bot,过高的误报率反而会造成更严重的后果。限制源IP一般只作为辅助手段。

(2) Cookie支持

Cookie支持可识别一些比较简单的Bot程序。简单的Bot程序不支持Cookie,我们可以在服务端写入Cookie的方式,来识别是否是Bot。由于Bot支持Cookie的时间成本很低,所以这一方式的效果较为有限。

(3) Bot行为分析

由于恶意Bot是通过模仿正常用户行为进行请求,具备一定的特征,通过分析和识别这些特征,即可检测出恶意Bot。

但“行为”是一个抽象概念,判断难度较高,一般企业难以投入大量时间和精力研究,只有专门从事安全工作的公司,会做出行为分析方案。例如蔚可云的“BotGuard爬虫管理”,可通过情报库、访问控制、陷阱诱导、人机交互、机器学习等技术,对访客进行行为分析,识别恶意Bot。

(4) IP情报信息分析

正常流量在相近的一段时间内,行为是正常的,而异常IP则不同。例如被用来发动DDoS的一台肉鸡,并不会只用来发动一次攻击,而是会在一段时间内,一直处于攻击状态。通过大数据分析技术,对历史事件进行威胁分析,能提前发现恶意Bot,并进行防御。

《第47次互联网络发展统计报告》显示,网站安全事件和信息系统漏洞,正在逐年减少,例如网站被篡改数量,2020年较2019年同期下降22.7%,但恶意Bot却在逐年增加,已成为企业不可忽视的一股黑产势力,防御恶意Bot任重而道远。

 

责任编辑:赵宁宁 来源: 今日头条
相关推荐

2016-12-08 16:47:06

2009-07-24 21:20:29

2020-04-02 11:06:56

网站安全HTTPS加密

2017-02-22 08:43:21

2023-05-04 07:11:29

2015-02-28 09:13:56

2020-07-25 18:04:21

Windows 10Windows勒索病毒

2009-09-24 12:57:18

2020-04-22 08:00:00

Linux恶意软件应用软件

2013-08-06 10:18:42

2011-08-23 13:56:00

2015-04-09 11:36:23

2020-12-22 10:48:22

Linux网络包网络模型

2021-07-23 11:07:22

物联网

2012-03-01 11:20:45

2012-02-09 09:32:39

2024-11-08 09:37:10

C#组件

2014-03-21 09:05:40

2024-08-30 15:03:43

点赞
收藏

51CTO技术栈公众号