想真正理解深度学习？需要知道这三件事-深度的理解

undefined

对于喜欢数据的专业人士来说，潜水堪称完美运动，因为收集数据是潜水的重要组成部分。慢慢地下降到深海中，你可以想象自己首次浸入未被开发的数据湖中。在成千上万的水下生物中，你可以寻找最大的鱼、最艳丽的珊瑚，这就像在庞大的数据集中寻找隐藏的洞见。

但是深度并非只与深海潜水有关。作为重要的概念，它在分析和机器智能领域也变得越来越重要。人工神经网络，即模仿人类大脑建立的、处理单元（人工神经元）相互关联的计算机模型，已经出现数十年了。早期，这些神经网络通常有1个或2个隐藏神经元层组成，现在已经从浅层结构进化到深层结构，后者又被称为深度学习。这种转变依赖于大规模建造大型和并行模型的成本不断下降，以及训练深度模型所需大型多维数据集的日益增多。

但要想真正理解深度学习，你需要首先了解这三件事：

1.深度学习是机器学习分支

从本质上看，深度学习隶属于机器学习范畴。但是标准的机器学习通常需要手工从数据中提炼模式，耗时费力。而深度学习模型擅长于自动捕获隐藏于大数据中的复杂结构模式，在对图像、视频、音频以及文本数据进行分析时，这种能力拥有巨大优势，而依靠手工从数据中提取模式很快将达到极限。

2.深度学习不只是技术动力室

到目前为止，大量学术机构和科技公司都在研究深度学习，媒体对深度学习相关成果的报道也日益增多，这都大大促进了深度学习的普及。现在，越来越多的公司正进入这个领域参加探索。有许多报道称，数据科学家正将深度学习方法应用到更广泛的行业分析领域，比如客户流失预测、金融欺诈调查、产品推荐等，传统企业对深度学习的兴趣日益增加。

3.深度学习的利弊权衡

企业需要了解，进入深度分析领域需要权衡利弊。尽管深度网络构架的精度可媲美甚至超越现有分析方式，但由此产生的模型通常是不透明的“黑盒子”，需要对其进行精调。深度学习往往需要预先架构投资，以便能处理模型的复杂性。大型神经网络往往需要数小时乃至数天的训练，如果没有事先考虑或准备，这可能对数据科学团队造成巨大影响。

为分析挑战选择正确的模型不仅仅是最大化模型精度的问题，它还受限于输入数据集。当涉及到传统分析时，模型的可解释性和简单性往往比精度要求更高。而要处理大数据集，建模方法的性能和可扩展性都需要被考虑到。依赖非操作性模型协助发现洞见的要求，与全面可操作性的建模构架完全不同。