梯度消失(VanishingGradient)与梯度爆炸(ExplodingGradient)梯度消失和梯度爆炸是深度神经网络训练中经常遇到的两个重要问题,尤其是在训练较深的网络时。这两个问题都会影响网络的训练效率,甚至导致训练失败。下面小A将详细讲解这两个问题。一.梯度消失概念梯度消失是指在训练深度神经网络时,反向传播过程中的梯度逐渐变小,最终导致梯度接近于零的现象。这使得神经网络的权重更新非常缓慢,甚至导致某些层的权重根本不...
今天我们要讲解的算法是Word2vec。Word2vec(wordtovector)顾名思义,这是一个将单词转换成向量形式的工具。通过转换,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。Word2vec主要分为CBOW(ContinuousBagofWords)又叫连续词袋和SkipGram两种模式,今天我们主要讲解的就是CBOW,接下来我们将从头到尾的详细讲解Word2vec算法流程。先来讲解一个背景知识:onehot向...
2025-01-09 12:57:05 197浏览 0点赞 0回复 0收藏
今天我们来讲一讲神经网络的参数到底是如何更新的!我们先来看看如下神经网络中的最后一个参数b3是怎样进行更新的。后面的章节再来讲w1w2w3b1b2是如何更新的。我们先假设w1w2w3b1b2参数均已得到最优解,分别如上图中绿色数据所示。假设我们要拟合的曲线如下图所示:我们先给b3赋一个默认的初始值0。假设最上面的绿色曲线是我们要拟合的真实曲线,最下面的绿色曲线是当前的预测曲线。我们先来求一个残差平方和,即对于所有的输入...
2024-12-31 13:13:52 217浏览 0点赞 0回复 0收藏
什么是梯度下降?梯度下降是一种用于优化目标函数的迭代算法。什么是目标函数?就是损失函数,损失函数(LossFunction)是在机器学习和深度学习中广泛使用的一个概念。它主要用于衡量模型的预测结果与实际结果之间的差异程度。简单来说,损失函数的值越小,说明模型的预测越准确。例如,在一个回归问题(比如预测房价)中,常用的损失函数是均方误差(MSE)。假设真实房价是y,模型预测的房价是y^,均方误差损失函数可以表示为...
2024-12-23 09:14:11 365浏览 0点赞 0回复 0收藏