中、小企业如何自建免费的云WAF-51CTO.COM

[[172639]]

WEB攻击是十几年来黑客攻击的主流技术，国内的大厂们早已把WAF作为安全基础设施的标配，市面上也有很多安全厂商提供了WAF产品或云WAF服务。

对于没有自己安全团队，却又饱受sql注入、xss、cc等WEB攻击的中、小企业，对WAF的需求也是非常迫切的。

目前获取WAF的途径有以下几种：

购买安全厂商的WAF产品
使用云waf服务，将自己域名的DNS服务器设为云waf厂商提供的，或者将需要接入云waf的域名cname过去
或者从网上找一些免费或开源的waf使用
自制WAF

对于收入不错的公司使用收费的产品或服务无可厚非，但是有些公司会因预算、数据私密性(云waf可以捕获所有流量的请求和响应的内容)等原因，不打算使用收费的产品或服务。

这种情况下只能使用免费的waf了，或者按业务需求自制一款适合自己的云WAF。

笔者会通过本文详细阐述如何用一周的时间自制一款简单易用的云WAF，以下为已经完成的云WAF的文档及github地址：

项目站点：https://waf.xsec.io/

Github地址：https://github.com/xsec-lab

云WAF架构设计

物理架构

根据业务场景或需求的不同，WAF也有不同的架构，比如：

以模块的形式集成到本地WEB容器中，如mod_security、Naxsi

反向代理模式

硬件产品WAF

Agent+检测云模式

本文实现的云WAF采用了反向代理模式的架构。

waf可以部署一台或者多台服务器中，如果业务规模较大，一台waf的性能已经无法满足业务需求，可以在waf前面使用LVS、haproxy、nginx等搭建负载均衡，通过VIP将前端的请求分发到后端的waf中。

后端的app server为提供正常业务的web server，用户的请求会先经过waf进行过滤，如果是恶意的攻击请求，则会在waf层面阻断，如果是正常的请求才会转发到后端服务器。

逻辑架构

x-waf由x-waf本身以及web管理后台x-waf-admin组成，其中：

x-waf基于openresty + lua开发

waf管理后台：采用golang + xorm + macrom开发的，支持二进制的形式部署

x-waf的实现

笔者呆过的2家公司都自主研发过云waf，架构一开始就设计成了适合大规模业务系统的，安装、部署、运维都比较复杂，不方便小企业快速部署，所以在参考了github中现有的开源的几款waf后，重新设计了一款轻量级的。

x-waf的执行流程

openresty默认不会执行lua脚本，需要在nginx.conf中进行配置，如下所示：

# 指定lua文件的查找路径 
 
lua_package_path "/usr/local/openresty/nginx/conf/x-waf/?.lua;/usr/local/lib/lua/?.lua;;"; 
 
# 定义2个lua shared dict变量分别为limit和badGuys，分配的内存大小为100M 
 
lua_shared_dict limit 100m; lua_shared_dict badGuys 100m; 
 
# 开启lua代码缓存功能 
 
lua_code_cache on; 
 
# 让nginx在init阶段执行init.lua文件中的lua代码 
 
init_by_lua_file /usr/local/openresty/nginx/conf/x-waf/init.lua; 
 
# 让nginx在每个http请求的access阶段执行access.lua文件中的lua代码 
 
access_by_lua_file /usr/local/openresty/nginx/conf/x-waf/access.lua;

openresty在init阶段会根据配置文件指定的位置导入json格式的规则到全局的lua table中，不同的规则放在不同的table中，以加快正则匹配的速度

waf = require("waf") wafwaf_rules = waf.load_rules()

waf.load_rules会根据配置文件中指定的路径加载读取所有json格式的规则，并加载到不同的table中，然后封装一个get_rule的函数，方便在每个http进来时可以直接从lua table中获取对应类型的规则：

local _M = { RULES = {} } 
 
function _M.load_rules() _M.RULES = util.get_rules(config.config_rule_dir) 
 
return _M.RULES end 
 
function _M.get_rule(rule_file_name) ngx.log(ngx.DEBUG, rule_file_name) 
 
return _M.RULES[rule_file_name] end

util.get_rules会将指定文件中的规则按规则名保存到lua table中供waf.get_rule函数在需要的时候获取规则：

function _M.get_rules(rules_path) 
 
local rule_files = _M.get_rule_files(rules_path) 
 
if rule_files == {} then return nil end 
 
for rule_name, rule_file in pairs(rule_files) do local t_rule = {} 
 
local file_rule_name = io.open(rule_file) 
 
local json_rules = file_rule_name:read("*a") file_rule_name:close() 
 
local table_rules = cjson.decode(json_rules) 
 
if table_rules ~= nil then 
 
for _, table_name in pairs(table_rules) do table.insert(t_rule, table_name["RuleItem"]) end end _M.RULE_TABLE[rule_name] = t_rule end 
 
return(_M.RULE_TABLE) end

每个请求进来时，waf会按ip白名单、ip黑名单、user_agent、是否cc攻击、url白名单、url黑名单、是否cc攻击、cookies、get和post参数的顺序进行过滤，如果匹配到其中任一种就会进行相应的处理(输出提示或跳转后)，之后就不会继续判断是否为其他类型的攻击了。

function _M.check() 
 
if _M.white_ip_check() then elseif _M.black_ip_check() then elseif _M.user_agent_attack_check() then elseif _M.white_url_check() then elseif _M.url_attack_check() then elseif _M.cc_attack_check() then elseif _M.cookie_attack_check() then elseif _M.url_args_attack_check() then elseif _M.post_attack_check() then else return end 
 
end

对每个请求的每种参数类型的判断都是先获取到参数内容，然后再循环与该类参数的正则规则进行匹配，如果匹配到则认为是攻击请求，以下为对post参数进行过滤的函数：

-- deny post function _M.post_attack_check() 
 
if config.config_post_check == "on" then ngx.req.read_body() local POST_RULES = _M.get_rule('post.rule') 
 
for _, rule in pairs(POST_RULES) do local POST_ARGS = ngx.req.get_post_args() or {} 
 
for _, v in pairs(POST_ARGS) do local post_data = "" if type(v) == "table" then post_data = table.concat(v, ", ") 
 
else post_data = v 
 
end if rule ~= "" and rulematch(post_data, rule, "jo") then util.log_record('Deny_USER_POST_DATA', post_data, "-", rule) 
 
if config.config_waf_enable == "on" then util.waf_output() 
 
return true end end end end end return false 
 
end

waf管理后台x-waf-admin的实现

waf的规则是以json格式的字符串，人工维护起来容量出错，另外云waf会有多台waf同时工作，如果人工做waf的后端主机的管理、规则同步与主机配置的同步等这些运维工作的话，非常容易出错或者疏漏，所以有必要提供一个自动化管理、同步配置的管理后台。

waf管理后台的功能需求

方便部署，启动前只需做简单的配置即可，第一次启动时，x-waf-admin会在mysql中生成默认管理员以及默认的waf规则;

用户管理，支持管理员账户的增、改、删;

waf规则管理，支持waf规则的增、改、删除以及策略同步到所有waf服务器的功能;

后端站点管理，支持接入waf的站点的增、改、删除，以及单独同步或全部同步接入的后端站点的功能。

程序结构

为了方便部署，x-waf-admin没有采用python、php等需要搭建运行环境或依赖第3方包的语言，而是用可以直接编译为可执行文件的go语言写的，具体的技术栈为go语言 + macron + xorm。

项目结构如下：

hartnett at hartnett-notebook in /data/code/golang/src/xsec-waf/x-waf-admin (master●) $ tree -L 2 ├── conf │ └── app.ini ├── models │ ├── models.go │ ├── rules.go │ ├── site.go │ └── user.go ├── modules │ └── util ├── public │ ├── css ├── README.md ├── routers │ ├── admin.go │ ├── index.go │ ├── rules.go │ ├── site.go │ └── user.go ├── server ├── server.go ├── setting │ └── setting.go └── templates

conf为配置文件目录

models目录下为orm文件

modules为功能模块组件

public和templates分别为静态资源及模板文件所在的目录

routers目录下的为各路由文件

setting目录下为配置文件处理的文件

server.go为程序入口

规则管理功能的实现

用户管理、后端站点管理与规则管理功能的实现大同小异，都是类似flask、martini、tornado、django等MTV WEB框架的应用，为了减少篇幅，本文只写后端站点管理功能如何实现，完整的代码请参见github。

后端站点管理的ORM实现

先用xorm定义site的struct，然后再提供增、改、删、查看等方法，这些方法会被routers模块中的site文件调用：

// 因篇幅太长，省略部分代码，详细代码请查看github 
 
// debuglevel: debug, info, notice, warn, error, crit, alert, emerg 
 
// ssl: on, off 
 
type Site struct { Id int64 SiteName string `xorm:"unique"` Port int BackendAddr []string Ssl string `xorm:"varchar(10) notnull default 'off'"` DebugLevel string `xorm:"varchar(10) notnull default 'error'"` LastChange time.Time `xorm:"updated"` Version int `xorm:"version"` // 乐观锁 
 
} 
 
func ListSite() (sites []Site, err error) { sites = make([]Site, 0) err = Engine.Find(&sites) 
 
log.Println(err, sites) 
 
return sites, err } 
 
func NewSite(siteName string, Port int, BackendAddr []string, SSL string, DebugLevel string) (err error) { 
 
if SSL == "" { SSL = "off" } 
 
if DebugLevel == "" { DebugLevel = "error" } _, err = Engine.Insert(&Site{SiteName: siteName, Port: Port, BackendAddr: BackendAddr, Ssl: SSL, DebugLevel: DebugLevel}) 
 
return err }

后端站点管理的路由实现

首先import相应的包，然后分别编写以下处理器：

增加站点的get与post请求的处理器(NewSite、DoNewSite)

修改站点的get与post请求的处理器(EditSite、DoEditSite)

根据ID删除站点的get处理器(DelSite)

同步站点配置的处理器(SyncSite)

同步站点配置的API的处理器以及根据ID同步站点配置的API的处理器(SyncSiteApi、SyncSiteById)

// 因篇幅太长，省略部分代码，详细代码请查看github 
 
func NewSite(ctx *macaron.Context, sess session.Store, x csrf.CSRF) { if sess.Get("uid") != "" { ctx.Data["csrf_token"] = x.GetToken() ctx.HTML(200, "newSite") } else { ctx.Redirect("/login/") } } 
 
func DoNewSite(ctx *macaron.Context, sess session.Store) { 
 
if sess.Get("uid") != nil { 
 
log.Println(sess.Get("uid")) siteName := ctx.Req.Form.Get("sitename") port := ctx.Req.Form.Get("port") Port, _ := strconv.Atoi(port) backaddr := ctx.Req.Form.Get("backendaddr") backendaddr := strings.Split(backaddr, "\r\n") BackendAddr := make([]string, 0) 
 
for _, v := range backendaddr { 
 
if v == "" { 
 
continue } v = strings.TrimSpace(v) BackendAddr = append(BackendAddr, v) } ssl := ctx.Req.Form.Get("ssl") debugLevel := ctx.Req.Form.Get("debuglevel") 
 
log.Println(siteName, BackendAddr, ssl, debugLevel) models.NewSite(siteName, Port, BackendAddr, ssl, debugLevel) ctx.Redirect("/admin/site/list/") } else { ctx.Redirect("/login/") } }

model的初始化

大家一定注意到了，虽然用了mysql，但是没有要求在使用前手工去导入建表或插入初始化值的sql脚本，这是为神马呢?

因为我们使用了ORM，ORM会帮我们自动完成上面所说的操作，如下代码所示：

// 因篇幅太长，省略部分代码，详细代码请查看github 
 
var ( Engine *xorm.Engine err error ) 
 
func init() { 
 
// 从conf/app.ini获取数据库的配置信息 sec := setting.Cfg.Section("database") 
 
// 连接数据库 Engine, err = xorm.NewEngine("mysql", fmt.Sprintf("%s:%s@tcp(%s)/%s?charset=utf8", sec.Key("USER").String(), sec.Key("PASSWD").String(), sec.Key("HOST").String(), sec.Key("NAME").String())) 
 
if err != nil { 
 
log.Panicf("Faild to connect to database, err:%v", err) } 
 
// 新建site、user和rules表 Engine.Sync2(new(Site)) Engine.Sync2(new(User)) Engine.Sync2(new(Rules)) 
 
// 如果user表为空，则新建一个默认账户， ret, err := Engine.IsTableEmpty(new(User)) 
 
if err == nil && ret { 
 
log.Printf("create new user:%v, password:%v\n", "admin", "x@xsec.io") NewUser("admin", "x@xsec.io") } 
 
// 如果规则为空，则插入默认的初始化规则 ret, err = Engine.IsTableEmpty(new(Rules)) 
 
if err == nil && ret { 
 
log.Println("Insert default waf rules") Engine.Exec(DefaultRules) } }

配置路由

当ORM、路由处理相关的代码写完后就可以在程序入口中配置路由了，将URL与路由处理的控制器对应起来，如下所示：

// 因篇幅太长，省略部分代码，详细代码请查看github 
 
m.Group("/admin", func() { 
 
m.Get("/index/", routers.Admin) 
 
m.Group("/site/", func() { 
 
m.Get("", routers.Admin) 
 
m.Get("/list/", routers.Admin) 
 
m.Get("/new/", routers.NewSite) 
 
m.Post("/new/", csrf.Validate, routers.DoNewSite) 
 
m.Get("/edit/:id", routers.EditSite) 
 
m.Post("/edit/:id", csrf.Validate, routers.DoEditSite) 
 
m.Get("/del/:id", routers.DelSite) 
 
m.Get("/sync/", routers.SyncSite) 
 
m.Get("/sync/:id", routers.SyncSiteById) 
 
m.Get("/json/", routers.SiteJSON) 
 
}) }) 
 
m.Group("/api", func() { 
 
m.Get("/site/sync/", routers.SyncSiteApi) 
 
m.Get("/rule/sync/", routers.SyncRuleApi) }) 
 
log.Printf("xsec waf admin %s", setting.AppVer) 
 
log.Printf("Run mode %s", strings.Title(macaron.Env)) 
 
log.Printf("Server is running on %s", fmt.Sprintf("0.0.0.0:%v", setting.HTTPPort)) 
 
log.Println(http.ListenAndServe(fmt.Sprintf("0.0.0.0:%v", setting.HTTPPort), m))

互动问题

从前有座山，山里有个庙，庙里有个灰帽子小明同学，他有次通过一些不可描述的手段，得到了某个网站的反弹Shell，虽是root权限，但利用方法不稳定。

此时小明发现服务器的内网网卡上跑着一个有root权限的redis，但加了密码，只见小明虎躯一震，顿时有了思路：留个webshell，以后通过webshell来执行redis反弹shell的exp。

但当他看完nginx的配置后又菊花一紧，因为这个站点只跑了lua的web应用.。