深度学习的工作原理：窥视驱动今日AI的神经网络的内部-51CTO.COM

【51CTO.com快译】今天人工智能的繁荣离不开一种名为深度学习的技术，该技术基于人工神经网络。本文通过图形解释了如何构建和训练这些神经网络。

图1. 架构图

人工神经网络中的每个神经元对输入求和，并运用激活函数以确定输出。这种架构的灵感来自大脑中的机理，其中神经元通过突触彼此之间传输信号。

图2

这是一个假设的前馈深度神经网络的结构(之所以是“深度”，是由于它有多个隐藏层)。该例子展示的一个网络解释了手写数字的图像，并将它们分类为10个可能数字中的一个。

输入层含有许多神经元，每个神经元都有一个激活(activation)，被设置为图像中一个像素的灰度值。这些输入神经元连接到下一层的神经元，在它们乘以某个值(称为权重)后传递其激活级别。第二层中的每个神经元对许多输入求和，并运用激活函数以确定输出，该输出以相同的方式前馈。

训练

这种神经网络通过计算实际输出和预期输出之间的差异来加以训练。这里的数学优化问题中的维度与网络中的可调参数一样多——主要是神经元之间连接的权重，可以是正[蓝线] 或负[红线]。

训练网络本质上是找到这种多维“损失”或“成本”函数的最小值。它在多轮训练中迭代完成，逐渐改变网络的状态。实际上，这需要根据为一组随机输入示例计算的输出对网络的权重进行多次小的调整，每次都从控制输出层的权重开始，然后通过网络向后移动。(为简单起见，这里只显示了与每一层中单个神经元相关的连接。)这个反向传播过程针对许多随机的训练样本集重复进行，直到损失函数最小化，然后网络提供它为任何新输入所能提供的最佳结果。