AI应用如何兼顾数据安全?看百度MesaTEE与飞桨联动

企业动态
SGX技术或者说TEE类技术的出现及演进,必将大大延展互联网信任的技术边界,基于此孵化出下一代区块链基础设施、高速多方的安全计算,将广泛应用于大数据分析和机器学习中,以此推动新一轮商业模式变革。

你知道整个人类社会,现阶段每年会产生多少,或者说多大体量的数据么?

IDC发布的《数据时代2025》报告显示,全球每年产生的数据将从2018年的33ZB增长到175ZB(1ZB约等于1万亿GB)[1]​,意味着它将会是可观测宇宙中星星数量的160倍。以25Mb/秒的网速,一个人要下载完这175ZB的数据,需要18亿年。

图1 数据来源:IDC

资料来源:数据时代 2025,赞助商:希捷,数据来自 IDC 全球数据圈,2018 年 11 月

人们对数据的重视程度与日俱增,可以说,谁能掌握和合理运用大数据的核心资源,谁就能在接下来的技术变革中进一步发展壮大。特别是在人工智能开始赋能千行百业的当下,丰富的数据可以帮助显著提升AI模型的精度,让企业从容面对业务发展和创新的需求,帮助企业进一步实现增效。但是在各行各业进行数据收集和利用的同时,数据泄露、数据滥用等安全事件频发,为个人隐私、企业商业秘密、国家重要数据等带来了严重的安全隐患。

数据可以造福人类,前提是保障安全

 数据安全问题是与我们每个人息息相关的,例如在公有云和区块链上,医疗健康和财务记录等敏感数据可能会被恶意程序窥探,造成隐私泄露;在数据交互时,不同类别的机密信息可能被中断、拦截,落入恶意使用者之手;机器学习模型或者安防模型一旦泄露,攻击者还可盗用知识产权或利用模型漏洞进行攻击,导致无法挽回的后果。

 因此,国内外各大知名软件厂商、硬件厂商以及芯片公司亟需发展基于硬件安全和软件安全的全方位服务框架。意在创建一种可信的执行环境,用安全可信赖的机制来保障数据安全,在受到攻击时最大程度确保隐私数据和计算模型不被泄漏或滥用,且同时提供功能、性能、兼容性和灵活性的支持。

英特尔与百度携手共建点石MesaTEE安全计算平台

​在全行业对数据安全的迫切需求下,百度MesaTEE安全计算平台应运而生,其基于英特尔® 软件防护扩展(Intel® Software Guard Extensions,英特尔® SGX)技术打造,可通过提供完整的“通用安全计算”方式,构建内存安全的可信计算平台,帮助大数据和AI产业提供数据隐私和安全解决方案。MesaTEE在隐私保护的前提下,打破产业链上下游既有的数据壁垒,有效解决数据流通与协作过程中的合法合规、数据安全问题。通过硬件创建的可信执行环境,帮助敏感的程序代码和关键数据得到芯片级的安全保障,确保其机密性和完整性,实现数据的“可用不可见”。

 英特尔® SGX为MesaTEE提供基于硬件的解决方案,使MesaTEE得以完善机密深度计算能力,从而保护敏感数据。商业版MesaTEE为厂商客户提供深度定制的商用解决方案,不仅支持基于英特尔® SGX的TEE计算引擎,而且独创了协同机密计算引擎,让大规模的隐私数据分析及训练成为可能。作为一个通用的机密计算平台,MesaTEE整体完全运行在TEE可信环境中,且完全使用Rust语言撰写,能够做到从数据上传数据处理到结果获取的全流程保护。此外,MesaTEE也是一个多方任务协作平台,能通过任务方式(类似于合同方式)来管理合作流程,确保执行流程不受外界干扰。这意味着参与方能在隐私信息不泄露的前提下,公平地完成任务协作,达成共识后获取到各自所需的计算结果或模型。

 MesaTEE安全计算平台通过私有化或云服务帮助金融、政务、互联网等行业在联合建模、联合营销、联合风控等场景下一站式完成数据联合计算,赋能企业机构合法合规的采集数据、存储数据、挖掘数据。

图2 百度MesaTEE整体架构

MesaTEE是基于英特尔® SGX打造的,英特尔® SGX的主要功能是可请求CPU在内存中分配出来一块受CPU保护的区域,也叫“飞地”,“飞地”中受保护的代码和数据不受操作系统或者VMM的影响,即便操作系统或BIOS这些底层的基础软件在黑客攻击中沦陷,通过SGX技术生成的“飞地”也能更有效地阻断这些攻击,尽力避免其中的应用程序和数据被非法的复制或篡改。

2021年发布的面向单路和双路服务器的第三代英特尔® 至强® 可扩展处理器,全产品线都对SGX技术实现了内置,且最多可在一个双路服务器系统中支持高达1TB的“飞地”空间,单颗处理器最高支持512GB,为企业实现更大数据量的隐私计算打下基础。目前,学术界和工业界已经对SGX技术展开了广泛的研究,SGX可被用于构建可信的身份认证环境、可信的网络通信通道、可信的系统审计、高效安全的密文计算机制、保护AI程序和云计算相关数据安全等方面。

英特尔® SGX为MesaTEE提供基于硬件的解决方案,其价值体现如下:

1. 安全:英特尔® SGX可以安全地将云用户的数据和代码执行隔离、加密,即使云计算环境里的操作系统、虚拟机管理器、或相邻的其他虚拟机被攻击或破坏,这些数据代码的完整性和保密性都能得到保障;

2. 高效:英特尔® SGX支持MesaTEE为各类TEE平台提供了统一的抽象API,开发者可以轻松地开发可迁移的TEE程序,且有大量实验数据标明,引用SGX不会给系统内存及性能带来压力;

3. 灵活:英特尔® SGX还能与其他TEE平台兼容,如TPM、MKTME、AMD SEV/SME、ARM TrustZone及FPGA等,MesaTEE提供了广泛的运行环境支持,也能为不同安全等级需求的场景提供不同宽松度的硬件依赖要求。

MesaTEE与百度飞桨联动,助深度学习兼顾效率与安全

MesaTEE在应用上,已经和主流云计算、区块链、及研究机构深入合作,综合推进硬件TEE、软件内存安全、和应用丰富强大的计算服务。基于百度安全计算服务框架MesaTEE的百度飞桨(PaddlePaddle)深度学习平台已为多个领域提供了机密计算的典型示例,打破了数据提供方、建模方与使用方之间的割裂及障碍,并且免除了软件层面的密文操作,执行速度快且能对抗服务端的恶意攻击。

 图3 基于英特尔® SGX的百度 MesaTEE 平台与百度飞桨平台联动

借助硬件级的英特尔® SGX技术,百度PaddlePaddle得以更高速地实现在嵌入式TEE环境中的运行,搭载新一代英特尔® 至强® 可扩展处理器时的运行速度快。此外硬件级解决方案排除了网络限制,避免了网络故障导致大型训练任务中断的风险,实现了对性能与安全更好的兼顾,构建了更安全的AI生态。

SGX安全计算的更多可能性和潜力

SGX技术或者说TEE类技术的出现及演进,必将大大延展互联网信任的技术边界,基于此孵化出下一代区块链基础设施、高速多方的安全计算,将广泛应用于大数据分析和机器学习中,以此推动新一轮商业模式变革。

对于企业和客户来说,英特尔® SGX技术经过了百度等诸多客户的探索并基于反馈进行调整,已经对于当前市场和业务具备较高的适配性,所以在未来也将会得到更多的实际部署。这不仅可以进一步放大企业的商业价值,更是为人工智能领域的发展提供源源不断的技术助力和数据积累。

参考白皮书:https://www.intel.cn/content/www/cn/zh/customer-spotlight/cases/security-processor-level-sgx-electronic-patient.html

架构师成长计划课程链接:https://bizwebcast.intel.cn/eventstart.aspx?eid=315&tc=u6s8lwaepl&frm=wechatkol

责任编辑:张燕妮
相关推荐

2022-05-23 11:19:15

Graphcore

2022-07-13 11:15:20

Graphcore

2019-07-03 18:28:47

百度飞桨华为

2010-01-28 10:29:44

2019-07-04 16:47:57

百度飞桨算力

2022-06-13 18:33:00

飞桨技术

2019-08-29 10:47:46

深度学习开发者百度浪潮

2018-09-06 18:37:45

百度云

2019-07-01 14:39:52

百度王海峰深度学习

2021-09-10 09:37:05

AI 数据人工智能

2020-04-23 11:20:12

百度

2015-04-16 10:22:35

2020-02-29 10:53:37

百度飞桨

2011-12-12 14:01:52

百度开放平台

2017-11-17 10:04:17

百度世界大会百度AI
点赞
收藏

51CTO技术栈公众号