鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

开源大模型可能不香了！您在微调开源大模型的时候，很可能已经泄露了您宝贵的数据！原创

发布于 2024-4-11 11:10

浏览

0收藏

如果你下载了一个大模型，你必须确认开发者没有设置后门！如果这些大模型设置了后门，他们可能会窃取你的微调数据！

近日，来自ETH的研究人员发表了一篇工作，其主要的灵感来自于联邦学习中的数据窃取攻击。研究人员为大模型添加了带有后门权重的梯度，并且这些梯度编码了一个训练输入。

开源大模型可能不香了！您在微调开源大模型的时候，很可能已经泄露了您宝贵的数据！-AI.x社区

如果一个不知道的受害者下载了这个带有后门的大模型，并在敏感数据上进行微调，新模型的权重将直接编码其中一部分的数据！

开源大模型可能不香了！您在微调开源大模型的时候，很可能已经泄露了您宝贵的数据！-AI.x社区

该工作中的设置比联合学习中的攻击更加困难，攻击者只能看到最终微调的模型，这类后门必须在微调期间仅执行一次。为此，研究人员通过设计一个 “锁” 来实现这一点：这是一个存储数据后会关闭的存储单元。

开源大模型可能不香了！您在微调开源大模型的时候，很可能已经泄露了您宝贵的数据！-AI.x社区

研究人员一系列技术手段，包括处理token、GeLUs、层归一化、注意力等，将这一后门设计扩展到Transformers模型中，结果得到了一个可以在ViTs和BERT模型中捕获训练输入的后门漏洞。注意，这里的是白盒的：攻击者需要看到受害者模型的最终权重。

开源大模型可能不香了！您在微调开源大模型的时候，很可能已经泄露了您宝贵的数据！-AI.x社区

进一步，研究人员在更强的黑盒设置中展示了：

攻击者可以使用模型窃取技术恢复数据
可以实现完美的黑盒成员推断攻击

开源大模型可能不香了！您在微调开源大模型的时候，很可能已经泄露了您宝贵的数据！-AI.x社区

该结果对差分隐私（DP）具有重要影响，如果使用DP-SGD训练一个带有后门的模型，黑盒攻击几乎与白盒攻击一样强大！

开源大模型可能不香了！您在微调开源大模型的时候，很可能已经泄露了您宝贵的数据！-AI.x社区

论文：https://arxiv.org/abs/2404.00473

代码：https://github.com/ShanglunFengatETHZ/PrivacyBackdoor

什么是后门漏洞？

后门漏洞（Backdoor Vulnerability）是指在计算机系统、软件或网络中存在的一种安全漏洞，它允许攻击者通过特定的非正常手段绕过正常的安全机制，获取未经授权的访问权限或执行恶意操作。后门漏洞通常由软件设计中的错误、缺陷或恶意代码引起。

后门漏洞的存在可能会导致严重的安全问题，包括但不限于数据泄露、系统被入侵、恶意软件传播、信息窃取和系统崩溃等。攻击者可以利用后门漏洞在系统中植入后门，以便以后能够不受阻碍地访问系统或执行恶意活动。

为了确保系统的安全性，开发者和安全专家通常会对系统进行定期的安全审计和漏洞扫描，以及采取必要的安全措施来修补和防范后门漏洞的出现。

本文转载自公众号AIGC最前线

原文链接：https://mp.weixin.qq.com/s/hxoMbWH3hKi63u6RlxMWAQ

©著作权归作者所有，如需转载，请注明出处，否则将追究法律责任

标签

已于2024-4-16 10:17:06修改

赞

收藏

回复

举报

回复

相关推荐

大模型嵌入学习机，打破教育的“不可能三角”

mb5f8eba9bdb0af • 2056浏览 • 0回复
GPT-4o背后可能的语音技术

鱼虫子 • 2160浏览 • 0回复
你知道什么是微调吗？大模型为什么要微调？以及大模型微调的原理是什么？

AI探索时代 • 5181浏览 • 0回复
大模型的泡沫什么时候破灭？

51CTO技术栈 • 1293浏览 • 0回复
SD3、FLUX.1等开源文生图模型，可能将无法使用

Aceryt • 1829浏览 • 0回复
什么时候需要训练和微调属于自己的大模型——小微企业必须要明白的问题

AI探索时代 • 1472浏览 • 0回复
不依赖CUDA的大模型推理已经实现

夜行神鱼 • 1791浏览 • 0回复
大语言模型评估基准数据泄露问题分析报告

芝士AI吃鱼 • 1935浏览 • 0回复
开源大模型如何治理？斯坦福基础模型研究中心给您支招

AIGC最前线 • 2030浏览 • 0回复
点滴成就，创造未来无限可能

AI.x社区官方账号 • 2330浏览 • 0回复
实测腾讯开源的Hunyuan-Large大模型，感觉......

NLP工作站 • 1431浏览 • 0回复
使用 LlamaFactory 结合开源大语言模型实现文本分类：从数据集构建到 LoRA 微调与推理评估

AI悠闲区 • 3420浏览 • 0回复
关于大模型的幻觉问题，大模型有可能做到百分之百的准确率吗？

AI探索时代 • 1234浏览 • 0回复
大模型超强内存优化：成本削减高达75%，性能不减弱！成果出自日本一初创AI公司之手；网友：电力可能够用了

51CTO技术栈 • 1307浏览 • 0回复
你可能不知道：Google AI正在悄悄改变各行各业

草台AI • 1148浏览 • 0回复
推理模型+Multi-Agent，可能就是Deep Research的全貌！

探索AGI • 1121浏览 • 0回复
DeepSeek太给力了！自家的大模型秘方开源到底！国产大模型雄起

51CTO技术栈 • 1699浏览 • 0回复
GPT-4.5发布了，参数规模可能在3-5万亿之间，宣称是最好的聊天模型，但有“强弩之末”的感觉

后向传播 • 932浏览 • 0回复
用 MCP 让大模型自动批量下载文献，太香了！

机器学习与数学 • 783浏览 • 0回复

轻薄滴假象

LV.6

这个用户很懒，还没有个人简介

觉得TA不错？点个关注精彩不错过

151

帖子

1112

声望

0

粉丝

关注

最近发布

预测未来模型能力！微调揭示LLM涌现能力的关键 2024-12-09 09:10:30发布
预测未来模型能力！微调揭示LLM涌现能力的关键 2024-12-03 15:46:55发布

热门推荐

综述：DeepSeek Infra/V1/MoE/V2/V3/R1 & 开源关键技术 0回复

实操干货！MCP 全解析，手把手教你基于 MCP 开发 Agent 0回复

90%的人都中招的低效陷阱！DeepSeek这招五分钟脑图法让你少熬10夜 1回复

从 Manus 到 DeepSearcher，2025年最值得关注的十大 Agent 智能体架构设计 0回复

算力租赁新趋势揭秘：如何高效利用云计算资源赋能未来 0回复

上一篇：基于数据正则化自博弈强化学习的人类兼容型自动驾驶

下一篇： CVPR 2024 Oral：生命之树大模型

社区精华内容

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载