拖动图像编辑再升级!北大、腾讯提出DragonDiffusion,在扩散模型上启用拖动式操作

人工智能 新闻
在本文中,我们提出了一种新颖的图像编辑方法DragonDiffusion,可在扩散模型上实现Drag式的操作。

北大、腾讯提出的DragonDiffusion可以对生成或真实的图像进行多种编辑,包括移动物体、调整物体大小、替换物体外观、拖动内容等。值得注意的是,所有编辑和内容保存信号都来自图像本身,模型不需要微调或额外的模块。

图片图片图片

论文介绍

图片

尽管现有的大规模文本转图像 (T2I) 模型能够从详细的文本描述生成高质量的图像,但它们往往缺乏对生成或真实图像进行精确编辑的能力。在本文中,我们提出了一种新颖的图像编辑方法DragonDiffusion,可在扩散模型上实现Drag式的操作。

图片

具体而言,我们根据扩散模型中中间特征的强对应性构建分类器指导。它可以通过特征对应损失将编辑信号转换为梯度,以修改扩散模型的中间表示。基于这种指导策略,我们还构建了一个多尺度指导,以考虑语义和几何对齐。此外,还添加了跨分支自注意力以保持原始图像和编辑结果之间的一致性。

图片

我们的方法通过高效的设计,实现了对生成或真实图像的各种编辑模式,例如对象移动、对象调整大小、对象外观替换和内容拖动。值得注意的是,所有编辑和内容保存信号都来自图像本身,模型不需要微调或额外的模块。

图片

方法

图片所提出的DragonDiffusion 的流程。我们提出的方法由指导分支和生成分支组成。指导分支通过中间特征的对应关系为生成分支提供编辑和一致性指导。

结果

物体移动结果

图片

物体外观替换结果

图片

内容拖拽结果

图片

责任编辑:张燕妮 来源: AIGC Studio
相关推荐

2025-01-21 10:45:00

训练模型架构

2024-03-11 09:37:01

模型图片编辑

2023-05-22 07:29:59

AIDragGAN

2025-01-17 10:30:00

2019-04-03 15:00:47

Python图像编辑工具

2023-12-23 23:04:26

AI模型

2023-10-11 12:32:26

模型训练

2023-01-02 13:12:07

模型图像

2024-07-08 08:47:00

2024-03-07 14:55:18

模型论文

2020-08-22 07:46:58

Photoflare开源图像编辑器

2025-01-06 10:30:00

图像AI模型

2025-01-07 11:00:00

AI生成

2023-04-13 15:55:00

AI开源

2019-12-02 15:23:34

FedoraLinuxGIMP

2022-05-07 15:59:36

AI模型

2024-01-16 17:17:30

模型训练

2024-11-04 10:05:00

AI模型

2015-03-27 15:41:42

AdobeAcrobat DC

2024-07-01 10:19:22

点赞
收藏

51CTO技术栈公众号