人工智能(Artificial Intelligence)入门看这篇就够了！-人工智能 artificial intelligence

要问现在的科技界什么最火？答案八九不离十是人工智能，机器学习，深度学习等等。事实上，人工智能所代表的一系列技术已经走入千家万户，深入我们的日常生活。公司门口的指纹门禁，手机拍照时的人脸聚焦，居家使用的扫地机器人，凡此种种，都可以看做是人工智能的衍生。

[[376224]]

人机对战国际象棋

从专业的角度来说，人工智能（AI）指的是在被编程为像人类一样思考并模仿其行为的机器中对人类智能的仿真。简而言之，让机器变得更像人类的动作和思维，比如机器人试图去模仿人类的动作，比如AlphaGo去模仿人类思考下围棋。考虑到人工智能的领域之广与大家现时的基础，我们以当下十分火热的计算机视觉问题为例，详细描述用计算机进行物体识别的过程，希望能够激发大家的兴趣。

计算机如何“看”东西？

人类在看到一张照片时，能够轻易的判断出照片的内容，这个过程涉及到复杂的生物和认知科学知识。简而言之，可以想象成，我们的眼睛接受了来自照片的信息，信息通过大脑内的神经元，经过复杂的处理，最终产生了相关的信号，比如“照片中有三个人，其中一个可能是妈妈还有两个是她的孩子”。

与人类类似，计算机同样经历了“信号获取”，“信号处理”，“信号反馈”的三个过程。摄像头，照相机等成像设备代替了眼睛，计算机芯片电路代替了脑内神经元，最后处理完的信号通过显示器进行反馈。

[[376225]]

利用手机摄像头进行花卉识别

我们以手机摄像头识别花卉为例，要经历怎样的过程才可以使我们的摄像头能够“认出来”花卉的种类呢？与人类类似，手机同样需要经历学习的过程，我们会先给“它”看很多很多的花卉照片并且告诉“它”这些照片所属于的类别，具体过程如下：

首先，摄像头拍摄花卉照片，在手机电脑等计算设备中，照片是以矩阵的形式存在的，可以理解成一堆数字，其中数字的大小代表了颜色和亮度等等信息；
我们将矩阵X输入到神经网络N(可以看做是一种复杂的数学函数，给一个输入值能够得到一个输出值)中，记录输出的数值Y；
由于这是学习过程，所以我们事先知道每张照片的真实类别Z，那么为了使我们的神经网络N有着正确的识别能力，Y应当和Z越近似越好。于是我们通过改变N的参数，使得Y与Z的距离变小；
重复1-3，当你认为Y和Z足够近似，模型的学习过程就结束啦！

有了学习完成的神经网络N后，当你用手机拍摄了一张新的花卉照片，摄像头会提取新的矩阵X'，X'经过神经网络的计算之后会得到Y'，我们比较Y'与所有的Z，最接近的那个就可以看做是新照片的类别啦。

当然，上述过程为了简单易懂省略了很多，也有部分不符合专业规范的表述，大家如果有兴趣的话可以持续关注我的更新，人工智能充满魅力！

新手如何入门机器学习？

首先需要说明的是，人工智能，机器学习和深度学习这三者是包含的关系，人工智能代表了广义的拟人化概念，机器学习特指利用统计学和数学模型进行建模，深度学习更进一步限制了模型的种类为深度神经网络，大家有个概念就可以，随着学习的深入会慢慢理解其本质。

三者的包含关系

在知乎上有些朋友曾经私信我，作为刚入门的新手如何学习机器学习呢？我很理解大家的困惑，如上所言，这是一个庞大且日新月异的领域，技术每分每秒都在更新，作为小白如何确定自己找对了方向呢？我的建议是，不要盲目追求新技术，当下涌现的大量新技术，事实上都是就技术的新子集，冠以高大上的命名。

以下内容涉及较专业的名词，不感兴趣的大家可以关掉啦~

不太清楚题主的风格，但我个人在接触一个新事物的时候会偏向于首先了解这个东西的动机起源。新手在接触机器学习时最大的困惑时，不知道如何下手。我个人认为，首先是确定你自己的兴趣方向，比如你要做视频图像的预测，那首先在方法层面上限制到生成模型上。

我们通过查阅文献可以知道，最早的生成模型比如从物理学能量模型启发而来的Boltamann Machine，比如深度置信网(Pretraining, Hinton 2006)，再到现在流行的GAN和VAE。这个过程可以适当缩短，因为State-of-art基本上没有在用玻尔兹曼机深度置信网这些老古董的。但是，但是，如果你真的想做出变革，我认为了解深刻的背景是很有必要的。比如Goodfellow为什么会提出GAN？你怎么能提出一个像GAN这样影响领域的东西？（我个人认为GAN的核心就是Discriminator，相较于常用的MSE，L1等等，Discriminator充当了更接近于人类的判断者角色，其数学推导也证明了DIscriminator能够最小化分布的距离。）

当你接触到GAN和VAE时，可能今天看了一篇CycleGAN，明天又读了一篇FactorVAE，但是这些不同的知识对于新手来说，是独立隔离的。事实上，以上两者都是属于深度生成模型，其中CycleGAN运用到了cycle consistency，这又是一个被广泛应用的技术；FactorVAE又涉及到Disentanglement机制，这涉及到可解释模型的概念。所以，在这一步，你需要更一步缩小你的目标问题。比如针对固定摄像头的异常事件预测（听起来怪怪的，举个例子不要在意）。

Deep Learning(花书)，据说已经有中文版面世~

这里强烈推荐Goodfellow和Bengio的Deep Learning，花书真的是一本很好的书，如果时间充足建议通读。当然，根据自己平时的需求去找到相关的章节也是可以的，但是前十章建议通读，这会减少你很多走弯路的时间。花书的优点是，所有你平时可能存在的小疑问这里都很详细的解释了动机。例如第7章对于Dropout机制的说明，此前我对于Dropout只停留在操作层面（我真的一直这么认为，没想过为什么），也是很多中文博客(很多英文直翻的博客额。。。)的内容，即，在前向传递的过程中随机将一些连接的weight设为0。是Bengio的解释点醒了我，这事实上就是一种Boost机制，每次前向传递事实上都训练了不同的子模型。当训练完成之后，在最后的test过程，就实现了Voting的过程。