随着大数据时代的到来,信息安全问题备受关注,用户对于个人隐私保护的要求越来越高。汽车之家作为国内最大的汽车垂直门户网站之一,一直致力于用户敏感数据保护。本文介绍,汽车之家通过研发”加解密中间件-AutoProxy”,实现敏感数据透明加解密,完成大量的历史存量及新增敏感数据的脱敏治理,更安全的保护用户信息。
1. 敏感数据治理背景
1.1数据安全及合规需求
数据安全事故时有发生,国家近年出台了《网络安全法》,《个人信息保护法》,《GB/T 35273 个人信息安全规范》,《关于开展互联网行业市场秩序专项整治行动的通知》等多部数据安全法律、法规进行个人信息保护。
图片
1.2数据脱敏方法
- 数据脱敏步骤
数据脱敏:敏感数据脱敏写入/读取需要经过如下步骤, 敏感数据识别→敏感数据脱敏→密文存储→解密读取。
图片
- 数据脱敏方案
依脱敏模块的位置不同,可分成三种情况:1. 应用层加解密SDK脱敏 2.中间层(API/Porxy)脱敏 3.数据库原生脱敏。其中“中间层脱敏”可以分成API脱敏,Proxy脱敏 两种子类; 而数据库原生脱敏需依赖于数据库本身的特性和函数,本文不做讨论。
图片
- 数据脱敏方案对比
对常见的脱敏方案从接入成本、维护成本、支持语言、SQL兼容性、性能等维度进行对比。
图片
2. 之家数据脱敏现状与挑战
2.1之家有大量数据需要脱敏
汽车之家作为国内最大的汽车垂直门户网站,存有大量的的存量及新增敏感数据如身份证号,手机号等用户信息等,需要脱敏(明文加密)存储。最近三年,之家敏感数据字段新增一直是增长趋势, 2022年涉及敏感数据的数据表列达到了1W列。
图片
2.2之家传统脱敏方法
为实现数据脱敏,之家提供自研API加解密接口来实现数据的脱敏。API脱敏方法如下图所示。
图片
2.3API脱敏问题与挑战
传统API脱敏是有侵入性,不能兼容SQL语法,数据脱敏成本较高的缺点。之家有大量的存量及新增敏感数据(要脱敏的敏感字段列>1W),因为安全合规需要在较短限期完成加密处理,繁重的工作量及成本是个挑战。
图片
3. 基于加解密中间件的数据脱敏实践
为了解决上节提到的传统API数据脱敏有侵入性,成本高的痛点问题。之家研发了基于加解密中间件“AutoProxy”的透明数据脱敏。本节主要内容如下:
图片
3.1面向应用透明的中间件脱敏
透明加解密是指在不影响应用程序的正常运行情况下,自动对数据进行加密和解密,不需要应用程序编写额外的加解密代码。透明加解密技术用于敏感数据脱敏可以对应用代码无侵入,避免传统API数据脱敏有侵入性,成本高的痛点。
图片
3.2数据脱敏方案选型
为了节约研发成本,我们计划选择一款开源软件进行"二次开发"来满足之家透明脱敏的需求。数据脱敏选型需要考虑的因素有脱敏功能、稳定性、运维成本、改造成本、生态情况等。
之家DBA团队调研/测试业界开源的脱敏工具,最终决定用Sharding-Proxy进行二开来实现数据脱敏,Sharding-Proxy是透明化的数据库代理,可支持自定义加解密算法,正满足之家脱敏需求。
3.3之家脱敏系统架构图
图片
3.4自定义加密算法
之家脱敏中间件"AutoProxy"支持MD5、AES、RC4、SM3/SM4等加密算法,同时支持自定义加解密算法。事实上为了原来的API脱敏兼容,AutoProxy使用了和原来API脱敏完全相同的自定义加密算法。
图片
3.5功能及性能测试
新产品上线前需要进行功能测试、性能测试、兼容性测试。经性能测试对比,之家中间件"AutoProxy"脱敏的性能较原来的API加密性能提升2倍。
图片
3.6之家脱敏自动化平台建设
►3.6.1 脱敏平台建设涉及工作
脱敏自动化平台化建设:主要涉及脱敏组件的安装布署、高可用、数据脱敏处理、工单申请等,目前这些工作都已实现自动化,提升工作效率及服务质量。
图片
►3.6.2 脱敏平台部分界面
图片
图片
3.7存量敏感数据脱敏
全新数据表的脱敏比较简单,仅需要直接接入脱敏中间件”AutoProxy“就可。存量历史数据脱敏,业务方常希望中间件可以在“不影响正常业务,即原敏感表可正常读写的情况下完成明文敏感数据脱敏”。存量敏感数据脱敏相对较复杂,下面做一简单步骤描述。
►存量敏感数据脱敏步骤:
- 给需要脱敏的字段,增加密文列。
- 研发申请脱敏中间件
- 业务修改DB后端地址为脱敏中间件地址(注意:此时新增数据会通过中间件的脱敏功能自动加密敏感数据,并存在相应的密文列)
- 通过工具对历史敏感数据全部刷新 (此时表中同时存在敏感明文列和密文列)
- 脱敏中间件切换到使用密文列模式 6.原明文敏感数据列删除。
3.8中间件AutoProxy脱敏成绩
"中间件-AutoProxy"实现了面向应用的透明数据脱敏,减轻了数据脱敏工作量。数据脱敏不再需要研发人员去修改业务代码,取而代之的仅需修改DB地址为脱敏中间件地址,并提相应的脱敏自动化工单。利用AutoProxy的助力,22年之家完成了近1W张敏感数据表的脱敏,实现了之家敏感信息全部密文存储,更安全的保护了之家用户信息。
4. 结语
本文介绍了敏感数据脱敏背景及常见技术。重点对汽车之家敏感数据治理实践进行阐述:之家原来使用API脱敏,存在脱敏成本较高的缺点。为此之家数据库团队新研发“脱敏中间件-AutoProxy”来进行数据脱敏。AutoProxy具有面向透明化数据脱敏,SQL语法兼容、支持自定义加密、性能优良等优点,利用AutoProxy的助力,22年之家完成了近1W张敏感数据表的脱敏。
未来之家将继续进行“脱敏系统平台”建设,在敏感数据表自动化识别,AutoProxy容器化等方向进行尝试。
作者简介
图片
陶会祥
■ 云平台部-云平台部-技术保障团队-数据库组
■ 2020 年加入汽车之家,C端及中台产研中心-云平台部,负责之家数据库/缓存的运维及RDS产品研发工作,致力于为公司提供安全,稳定,可靠的数据库/缓存服务。