对于喜欢数据的专业人士来说,潜水堪称完美运动,因为收集数据是潜水的重要组成部分。慢慢地下降到深海中,你可以想象自己首次浸入未被开发的数据湖中。在成千上万的水下生物中,你可以寻找最大的鱼、最艳丽的珊瑚,这就像在庞大的数据集中寻找隐藏的洞见。
但是深度并非只与深海潜水有关。作为重要的概念,它在分析和机器智能领域也变得越来越重要。人工神经网络,即模仿人类大脑建立的、处理单元(人工神经元)相互关联的计算机模型,已经出现数十年了。早期,这些神经网络通常有1个或2个隐藏神经元层组成,现在已经从浅层结构进化到深层结构,后者又被称为深度学习。这种转变依赖于大规模建造大型和并行模型的成本不断下降,以及训练深度模型所需大型多维数据集的日益增多。
但要想真正理解深度学习,你需要首先了解这三件事:
1.深度学习是机器学习分支
从本质上看,深度学习隶属于机器学习范畴。但是标准的机器学习通常需要手工从数据中提炼模式,耗时费力。而深度学习模型擅长于自动捕获隐藏于大数据中的复杂结构模式,在对图像、视频、音频以及文本数据进行分析时,这种能力拥有巨大优势,而依靠手工从数据中提取模式很快将达到极限。
2.深度学习不只是技术动力室
到目前为止,大量学术机构和科技公司都在研究深度学习,媒体对深度学习相关成果的报道也日益增多,这都大大促进了深度学习的普及。现在,越来越多的公司正进入这个领域参加探索。有许多报道称,数据科学家正将深度学习方法应用到更广泛的行业分析领域,比如客户流失预测、金融欺诈调查、产品推荐等,传统企业对深度学习的兴趣日益增加。
3.深度学习的利弊权衡
企业需要了解,进入深度分析领域需要权衡利弊。尽管深度网络构架的精度可媲美甚至超越现有分析方式,但由此产生的模型通常是不透明的“黑盒子”,需要对其进行精调。深度学习往往需要预先架构投资,以便能处理模型的复杂性。大型神经网络往往需要数小时乃至数天的训练,如果没有事先考虑或准备,这可能对数据科学团队造成巨大影响。
为分析挑战选择正确的模型不仅仅是最大化模型精度的问题,它还受限于输入数据集。当涉及到传统分析时,模型的可解释性和简单性往往比精度要求更高。而要处理大数据集,建模方法的性能和可扩展性都需要被考虑到。依赖非操作性模型协助发现洞见的要求,与全面可操作性的建模构架完全不同。