大模型图像处理技术之扩散模型——Diffusion Model 原创

发布于 2024-10-23 16:15
浏览
0收藏

“ 大模型的原理就是通过编程实现的某种数学算法模型,把输入数据进行处理,最后再输出的一个过程 ”

这段时间的文章中,一直都是在说大模型的应用,也就是怎么基于大模型开发上层应用,以及在开发过程中遇到的一些问题;但同样在文章中也说过从应用入手,然后再了解其实现原理,这就是知其然,再知其所以然。

最近一直在搞图片生成和视频生成方面的应用,但使用的不是第三方的接口,就是现有的开源模型,虽然知道它们能做些什么,但却不知道到底怎么做到的,因此今天就来了解一下图像处理中一个很经典模型——扩散模型。

扩散模型

下面我将从几个方面简单描述一下扩散模型,可能不一定对,就当作是自己的学习笔记了。

首先,我们先从概念的方面了解一下什么是扩散模型;扩散模型是图像生成模型的一种,有别于此前AI领域大名鼎鼎的GAN,VAE等算法,扩散模型另辟蹊径,其主要思想是一种先对图像增加噪声,再逐步去噪的过程,其中如何去噪还原图像是算法的核心部分;而它的最终算法能够从一张随机的噪声图像中生成图像。

上面这段话来源于网络,也不知道对不对,准不准确;但这个并不重要,首先从表面上看起来好像还是很高大上的。

大模型图像处理技术之扩散模型——Diffusion Model-AI.x社区

为什么说扩散模型的概念不重要? 

其实这是一个个人的学习方法,在学生时代老师讲到一个新的知识点,第一件事就是介绍定义或者说概念,但说实话记不住,也听不懂,基本上没啥用。

随着自己学习的深入,以及对其本身对理解,自己慢慢就可以下一个定义了;还有一部分原因就是,有些人看概念会钻牛角尖;比如说为什么是增加噪声,是不是还有其它的方式,其它的方式又是什么等等。

而且,从网络上的资料来看,扩散模型最主要的一点就是噪声,不论是去噪声还是加噪声;只不过怎么去噪声加噪声,就有不同的实现方式及算法;而说的最多的就是基于概率学,对图像噪声进行处理。

特别喜欢之前在网上看的技术学习视频,其中有一个培训机构的某位老师的口头禅就是——任何天上飞的理念都会有落地的实现。

扩散模型是一种图像处理的思想,而噪声是其主要的表现形式,也是图像处理领域中的一个重要节点;而关于怎么处理噪声就有多种不同的实现方式, 比如说过滤。

扩散模型的组成

扩散模型由正向过程——扩散过程和反向过程——逆扩散过程组成,其中输入数据逐渐被噪声化,然后噪声被转换回源目标分布的样本。

可能有些人看到上面这段话又有点懵逼了,既然扩散了为什么又要逆扩散,数据噪声化又是什么意思? 

首先我们来了解一下什么是图像的噪声?

了解过成像原理的人应该都知道,所谓的图像其实就是无数个点组成,这个点就是像素点,图像不同的位置点的密集度不一样,因此就呈现了图像。

而图像噪声就是图片中一些干扰信息,比如说有的手机拍摄的照片不清晰,就是像素点不够密集,还有些照片特别模糊就是因为图片噪声太多,影响到了原有图片的效果。


大模型图像处理技术之扩散模型——Diffusion Model-AI.x社区

而扩散模型的原理就是,使用大量的训练数据,通过去噪声和增加噪声的方式,让模型学习去噪和增加噪声的方式方法。

然后训练完成之后,就可以根据“经验”,去对未知的图像进行增加噪声和去噪处理,然后生成一个新的图像。


因此,扩散模型的本质就是,通过连续添加高斯噪声来破坏训练数据,然后通过反转这个噪声的过程来恢复数据。


训练结束后,可以使用扩散模型将随机采样的噪声传入模型中,通过学习去噪过程来生成数据。


而在具体到算法实现,就是通过马尔可夫链等基于概率与统计模型,实现了解过去,明白现在,预测未来的过程。


马尔可夫链是一种状态空间中经过从一个状态到另一个状态到随机过程。


事实上前面说了这么多,也仅仅只是了解扩散模型的基本实现原理,但具体应该怎么实现,马尔可夫链的实现过程,比如状态转移是怎么实现的,其数学模型是什么样的,以及基于编程实现的概率统计等。

大模型图像处理技术之扩散模型——Diffusion Model-AI.x社区

在此之前,一直不明白大模型算法的原理,到今天才明白,所谓的大模型算法,其实就是使用数学理论,通过编程的手段来实现,然后来计算或描述一个具体的任务过程。

现在如果再让我讲大模型的原理,所谓的大模型就是通过读取某种数据集,通过某种算法进行处理——模型架构(比如机器学习算法,Transformer架构等),得到数据集之间的某种数学关系,并记录下来——训练之后的模型参数,然后大模型以后就可以根据这种关系,去分析和处理新的未知数据。

本文转载自公众号AI探索时代 作者:DFires

原文链接:​​https://mp.weixin.qq.com/s/lHkYPTtzweZqhAjNIKv3uw​​​

©著作权归作者所有,如需转载,请注明出处,否则将追究法律责任
收藏
回复
举报
回复
相关推荐