CVPR 2024 Spotlight | 解锁图像编辑新境界, 北大、腾讯提出DiffEditor,让精细编辑更简单!

人工智能 新闻
DiffEditor是一种高效且灵活的图像编辑方法,能够无缝融入各种精细图像编辑任务,无需针对特定任务进行训练。

本文经AIGC Studio公众号授权转载,转载请联系出处。

在图像生成领域,大型文本到图像(T2I)扩散模型近年来取得了革命性的突破。然而,将这些强大的生成能力转化为精细的图像编辑任务,仍面临诸多挑战。CVPR 2024, 来自北京大学深圳研究生院与腾讯PCG的研究团队提出了一种创新的图像编辑方法——DiffEditor,该方法不仅显著提升了编辑的准确性和灵活性,还拓宽了扩散模型在图像编辑领域的应用边界。图片DiffEditor可以对一般图像执行各种细粒度的图像编辑操作。给定一张图片,用户可以选择一个对象进行移动或调整大小,也可以选择多个像素点进行更精确的内容拖动。此外,用户还可以选择参考图像进行跨图像编辑,即对象粘贴和外观替换。

图片

相关链接

  • 论文:https://arxiv.org/pdf/2402.02583
  • 项目:https://github.com/MC-E/DragonDiffusion

背景与挑战

现有的基于扩散模型的图像编辑方法,如DragDiff和DragonDiff,虽然在一定程度上实现了图像的精细编辑,但仍存在局限性。DragDiff受限于GAN模型的容量,而DragonDiff则在编辑过程中牺牲了部分灵活性。此外,这些方法往往忽视了文本提示在精细编辑中的潜在作用,导致编辑结果在某些场景下缺乏细节和准确性。

方法

图片DiffEditor 概述,它由可训练的图像提示编码器和带有不需要训练的编辑指导的扩散采样组成。

  1. 引入图像提示:DiffEditor首次尝试将图像提示引入精细图像编辑任务中,与文本提示相结合,为编辑内容提供了更详细的描述,从而显著提高了编辑质量。
  2. 区域SDE策略:为了提升编辑的灵活性,DiffEditor提出了一种区域随机微分方程(SDE)策略,该策略能够在编辑区域注入随机性,同时保持其他区域的内容一致性。
  3. 时间旅行策略:为了进一步改善编辑质量,DiffEditor引入了时间旅行策略,在单个扩散时间步内建立循环指导,从而精炼编辑效果。

图像提示编码器设计说明

图片

实验与性能

图片

DiffEditor与其他面部处理方法的定性比较。当前点和目标点用红色和蓝色标记吗,白线表示距离,结果和目标之间的 MSE 距离用黄色标记。

图片

提出的方法与其他方法在外观替换、对象粘贴和对象移动任务上的视觉比较。

图片

不同扩散模型上的编辑结果可视化。

综上所示,研究团队通过大量实验验证了DiffEditor在各种精细图像编辑任务(如内容拖动、对象移动、缩放、粘贴和外观替换)中的优越性能。与现有的基于扩散和GAN的方法相比,DiffEditor不仅具有更高的编辑准确性和内容一致性,还保持了良好的灵活性。特别是在需要想象新内容的场景中,DiffEditor能够产生更自然的结果。

结论

DiffEditor是一种高效且灵活的图像编辑方法,能够无缝融入各种精细图像编辑任务,无需针对特定任务进行训练。尽管DiffEditor已经取得了显著成果,但在某些需要大量内容想象的场景中,如旋转汽车的前部,仍存在一定的编辑难度。研究团队认为,这主要归因于基础模型SD的多样性限制。未来,他们将继续探索更先进的模型架构和训练策略,以进一步拓展DiffEditor的应用范围和编辑能力。

责任编辑:张燕妮 来源: AIGC Studio
相关推荐

2025-02-05 09:30:00

图像模型生成

2020-08-22 07:46:58

Photoflare开源图像编辑器

2025-01-17 10:30:00

2019-04-03 15:00:47

Python图像编辑工具

2023-01-02 13:12:07

模型图像

2021-02-16 09:37:01

Filmulator开源图像编辑器

2015-03-27 15:41:42

AdobeAcrobat DC

2024-03-11 09:37:01

模型图片编辑

2023-07-04 21:59:46

文档编辑器PowerNice

2022-07-04 08:30:52

powerNice富文本编辑器

2024-05-30 00:00:01

GPT-3.5SOTASDXL

2025-02-05 10:15:00

2025-01-07 11:00:00

AI生成

2021-12-27 08:08:41

微软WindowsWindows 11

2023-05-22 07:29:59

AIDragGAN

2019-01-04 10:00:48

开源技术 趋势

2025-01-20 10:36:00

训练模型AI

2022-06-05 23:28:50

TypeScripinfer类型

2021-07-24 13:16:31

Android 代码操作系统

2020-11-22 21:47:26

Photoshop工具开源
点赞
收藏

51CTO技术栈公众号