鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程软考华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

值得你花时间看的扩散模型教程，来自普渡大学

轻薄滴假象

发布于 2024-4-7 10:11

浏览

0收藏

扩散模型（Diffusion Model）是图像生成模型的一种。有别于此前 AI 领域大名鼎鼎的 GAN、VAE 等算法，扩散模型另辟蹊径，其主要思想是一种先对图像增加噪声，再逐步去噪的过程，其中如何去噪还原图像是算法的核心部分。而它的最终算法能够从一张随机的噪声图像中生成图像。

值得你花时间看的扩散模型教程，来自普渡大学-AI.x社区

近年来，生成式 AI 的惊人增长为文本到图像生成、视频生成领域等许多令人兴奋的应用提供了支持。这些生成工具背后的基本原理是扩散的概念，这是一种特殊的采样机制，克服了以前的方法中被认为难以解决的一些缺点。

最近，来自普渡大学的 Stanley H. Chan 发布了一份扩散模型的教程《Tutorial on Diffusion Models for Imaging and Vision》，对该方向技术进行了直观详尽的解释。

本教程的目标是讨论扩散模型的基本思想，目标受众包括对扩散模型研究，或应用这些模型正在解决其他问题的本科生和研究生。

值得你花时间看的扩散模型教程，来自普渡大学-AI.x社区

文章链接：https://arxiv.org/abs/2403.18103

该教程包括四个部分，涵盖了最近研究文献中支持扩散生成模型的一些基本概念：变分自编码器（VAE）、DDPM（Denoising Diffusion Probabilistic Models）、SMLD（Score Matching with Langevin Dynamics）和 SDE，从多个角度独立导出了相同的扩散思想，共长 50 页。

值得你花时间看的扩散模型教程，来自普渡大学-AI.x社区

作者介绍

这篇教程的作者是美国普渡大学电气与计算机工程学院和统计学系 Elmore 副教授 Stanley H. Chan。

值得你花时间看的扩散模型教程，来自普渡大学-AI.x社区

Stanley Chan 2007 年在香港大学获得学士学位，2009 年、2011 年分别在加州大学圣地亚哥分校获得数学硕士学位和电气工程博士学位。2012 年至 2014 年在哈佛大学约翰・A・保尔森工程与应用科学学院担任博士后研究员。2014 年加入普渡大学。

Stanley Chan 主要从事计算成像研究。他的研究任务是通过共同设计传感器和算法来构建智能相机，以实现在所有成像条件下的可视性。

Stanley Chan 还多次获得论文奖项，包括 2022 年 IEEE 信号处理学会（SPS）最佳论文奖、2016 年 IEEE 国际图像处理会议（ICIP）最佳论文奖等等。

值得你花时间看的扩散模型教程，来自普渡大学-AI.x社区

本文转自机器之心，作者：机器之心

原文链接:https://mp.weixin.qq.com/s/s-d_VK1ln7ysKL8QIftxNA

标签

赞

收藏

回复

举报

回复

相关推荐

来自Anthropic：如何衡量大语言模型的说服力？

AIGC最前线 • 2023浏览 • 0回复
这28种方法值得一看

51CTO技术栈 • 1597浏览 • 0回复
详细教程！探索DALL·E的强大功能！

echo_ning • 1983浏览 • 0回复
基于扩散模型的，开源世界模型DIAMOND

Aceryt • 1717浏览 • 0回复
基于Transformer的时间序列综述

AI论文解读 • 1972浏览 • 0回复
揭秘神秘的种子：Adobe联合宾夕法尼亚大学发布文本到图像扩散模型大规模种子分析

angel • 1503浏览 • 0回复
看张手绘草图就能合成图形程序，加州伯克利让扩散模型掌握新技能

轻薄滴假象 • 1416浏览 • 0回复
快手开源图生视频模型LivePortrait，等待生成时间仅需10秒，弃扩散改用隐式关键点框架技术，网友：强得可怕

51CTO技术栈 • 4334浏览 • 0回复
如何改良基于Basis的时间序列预测模型？

海因斯DK • 1466浏览 • 0回复
学会区分大模型——大模型的分类，让你更清晰的认识大模型

AI探索时代 • 5626浏览 • 0回复
一文总结扩散模型（Diffusion Model）在时间序列中的应用

海因斯DK • 7155浏览 • 0回复
TSLANet：时间序列模型的新构思

鲁班模锤1 • 1325浏览 • 0回复
Qwen2.5系列模型开源，你值得拥有！！！

NLP工作站 • 5611浏览 • 0回复
你对大模型认知的开始——大模型的能力问题

AI探索时代 • 1023浏览 • 0回复
【智汇金秋创造季】智汇成海，致敬开发者的“超级码力”！

AI.x社区官方账号 • 32.9w浏览 • 148回复
HuggingFace模型转一键llamafile包完整教程，通义千问成功案例分享

凝固的雨_1 • 2112浏览 • 0回复
浅看大模型用于Text2SQL的综述

大模型自然语言处理 • 1584浏览 • 0回复
2024，中国大模型落地究竟如何，这些人和企业值得关注！

51CTO技术栈 • 827浏览 • 0回复
大模型 SFT 有监督微调教程

AI悠闲区 • 323浏览 • 0回复

轻薄滴假象

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

DeepSeek一口气开源3个项目，还有梁文锋亲自参与，昨晚API大降价 2025-02-27 12:40:06发布
全球首个AI CUDA工程师来了！将PyTorch原生实现提速10-100倍 2025-02-21 13:20:31发布

热门推荐

4090单卡部署满血 671B DeepSeek，本地部署“成本骤降32倍”！！！ 0回复

从推理到编程，详细比较DeepSeek 32B、70B、R1实践性能 0回复

综述：DeepSeek Infra/V1/MoE/V2/V3/R1 & 开源关键技术 0回复

低成本+高性能+超灵活！Deepseek 671B + Milvus 重新定义知识库搭建！ 0回复

DeepSeek R1 全系列模型部署指南 0回复

上一篇：还得是抖音，字节推出竖屏视频理解数据集，入选CVPR2024

下一篇：让智能体像孩子一样观察别人学习动作，跨视角技能学习数据集EgoExoLearn来了

社区精华内容

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载