鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

DeepNetwork中一般Dropout原理

发布于 2025-1-24 10:50

浏览

0收藏

Dropout现在这个操作在目前这个深度学习时代中是非常常见的一个操作。对于Dropout的好处我们也听过很多，降低过拟合，提高模型的鲁棒性，控制模型复杂度等blabla。。

但我比较好奇的是，Dropout是怎么实现以上好处，经过一番了解，简单描述下。

DeepNetwork中一般Dropout原理-AI.x社区

Dropout实际上我们可以先理解成给予Network结构中的一种噪音，但是我们这个噪音不是随便给，是有一定数学理论支撑，我们是选择无偏差地往网络结构中加入噪音。

DeepNetwork中一般Dropout原理-AI.x社区

DeepNetwork中一般Dropout原理-AI.x社区

通常来说，训练的时候才需要用到dropout，推理的时候不需要。理由也很简单，一个保证推理的时候有确定性输出，另一个是dropout的好处并没有在推理时体现，无需徒增计算。

DeepNetwork中一般Dropout原理-AI.x社区

这是李沐在《动手学深度学习》里面实现的代码，不得不说真的简单易懂。

当dropout等于1的时候，要返回跟上一层输出shape一致的全零矩阵。当dropout=0时，说明无需丢弃，则返回原值。

当在0<dropout<1之间，(torch.randn(X.shape) > dropout).float()生成一个跟X的shape一致的零一矩阵表示不同输出与否，然后这个mask*X就是实际输出的X结果，再除以之前期望公式所需要的(1-dropout)，得到最终结果。

论文出处：https://www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf

本文转载自沐白AI笔记，作者：沐白

标签

赞

收藏

回复

举报

回复

相关推荐

深入理解Sora技术原理

卓胜微wjp • 2044浏览 • 0回复
LLM CoT的工作原理

ceesoft • 1284浏览 • 0回复
VAE变分自编码器原理解析看这一篇就够了！另附Python代码实现

angel • 4786浏览 • 0回复
Agent四大范式 | 综述：全面理解Agent工作原理

大语言模型论文跟踪 • 4379浏览 • 0回复
深入剖析时序Prophet模型：工作原理与源码解析

卓胜微wjp • 1343浏览 • 0回复
Aditya Ramesh讲DALL·E 2基本原理

AIGC最前线 • 1439浏览 • 0回复
GraphRAG项目雨后春笋般涌现！

PaperAgent • 1513浏览 • 0回复
【创新一夏学习季】热浪升温，创新一夏，释放开发潜能

AI.x社区官方账号 • 52.6w浏览 • 39回复
谷歌开源Gemma Scope，更好解释大模型工作原理

Aceryt • 1300浏览 • 0回复
一文彻底理解大模型 Agent 智能体原理和案例

玄姐聊AGI • 2028浏览 • 0回复
多模态大模型的实现原理，以及技术难点

AI探索时代 • 1683浏览 • 0回复
从原理到挑战，梳理AI智能体应用

小虎哦哦 • 1328浏览 • 0回复
一文彻底理解大模型 Agent 智能体原理和案例

玄姐聊AGI • 1673浏览 • 0回复
一文详解MHA、GQA、MQA原理

毛毛雨_11 • 1183浏览 • 0回复
文档截图嵌入统一多模态检索方法原理

毛毛雨_11 • 461浏览 • 0回复
一文详解集成学习算法原理

宝宝数模AI • 406浏览 • 0回复
大模型底座之向量化，以及向量化的原理

AI探索时代 • 525浏览 • 0回复
Word2vec算法原理详解

人工智能训练营 • 201浏览 • 0回复
大规模相似性搜索：原理、技术与 Faiss 实践

柏企阅文 • 291浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

选择哪个Batchsize对模型效果最好？ 2025-01-15 12:56:14发布
一文讲清楚视觉大模型！CLIP模型论文解读 2025-01-07 11:46:37发布

热门推荐

寻找乐子人｜ “多语言、精准定位”上海导游智能体搭建方案 2回复

大模型厂商视角的AI Agent综述，Anthropic图文并茂多个案例教你构建有效智能体 0回复

人工智能智能体(AI Agent)发展趋势2024年总结与2025年展望 0回复

2025 年：如何构建有效的智能体 0回复

谷歌AI发布Gemini 2.0 Flash：比Gemini 1.5 Pro快2倍的新AI模型 0回复

上一篇：选择哪个Batchsize对模型效果最好？

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载