机器学习技术对保险行业的影响-51CTO.COM

【51CTO.com快译】利用机器学习成果推动业务绩效提升的作法在过去18个月中已经得到广泛认可，而我们也一直在同各类保险机构探讨这项技术所能带来的应用潜力和价值。

首先，机器学习必将改变保险公司的经营方式。长久以来，保险公司的核心任务在于预测未来事件，并评估这些事件的价值/影响。这一评估过程通过预测模型实现——特别是索赔损失的预测与定价。而随着大数据及新型数据源的出现，传感器/远程信息处理、外部数据源、数字化(交互)、社交与网络(情绪倾向)等领域中的数据技术应用将让保险业务拥有更可观的运营空间。

机器学习如今已经成为保险公司的一类重要工具，被广泛应用于核心价值链内以了解风险、索赔与客户体验情况。带来的更为灵活/复杂的模型可帮助保险公司提升预测准确性。不过相较于传统统计方法，机器学习需要强大的数据分析能力，同时有能力计算看似无关的结构化、半结构化与非结构化数据集。

举例来说，基于机器学习的数据模型现在可分析：

结构化数据: 损失类型、损失金额与医师身份等。

文本: 笔记、日记、医疗费用、事故报告、存款、社交数据与发票等。

空间图表: 事故地点、工作地点、各方关系(医师、索赔人、维修设施)等。

时间序列: 事件/行动序列、索赔日期、事故日期、事件/行动持续时间等。

如今，保险公司拥有远超以往的承保/债权票据与记录(非结构化数据)评估能力，同时也可以高效地处理各类标准化文件。

定价风险、定损以及欺诈监控等工作对于机器学习方案而言非常重要。保险公司引入机器学习算法，主要用于处理风险相似性分析、风险倾向与溢价评估。另外，也被广泛应用于索赔频率/严重性、管理费用、代位追偿(一般性保险)、诉讼与欺诈的核定。

机器学习中***影响力的用例在于从以往索赔审计中学习经验，从而确保以往问题能够被保险公司发现并借此汲取绝对值。索赔审计长久以来一直以人工方式完成，但如今机器学习技术能够贯穿整个生命周期强化评估能力，并通过持续处理提升自身能力。

此类索赔处理算法也可用于监控及检测欺诈活动。不过，***的限制因素在于保险公司实际掌握的索赔欺诈案例/实例数量。这也是决定传统与机器学习模型实际成效的基本条件。

很多保险公司会问，机器学习能否明显降低欺诈率。我的答案是，机器学习能够切实影响到各类早期识别技术，或者说“反欺诈”技术。其中的关键要素在于减少误报，并利用机器学习算法以确定哪些索赔存在潜在欺诈可能。

保险公司可以通过两种技术应用方式降低欺诈活动数量：欺诈的早期识别以及在欺诈调查工作中投入时间资源。由此带来的索赔支付速度提升也将令客户获得更高满意度。

利用机器学习技术，保险公司将能够把索赔数据(无论其具体类型)加载至巨大的存储库内，即所谓“数据湖”。在欺诈检测工作中，索赔审计、日志与文件将成为发现欺诈活动的关键所在，具体流程包括：

学习阶段: 进行数据训练或者从欺诈性索赔与真实索赔中进行学习。具体包括预处理(标准化、降维、图像处理、航空图像等)、学习(监督、非监督、最小化等)以及错误分析(精度、召回、过度拟合、测试/交叉验证等)。

预测阶段: 正式使用来自学习阶段的模型并应用于新数据，而后部署以实现欺诈检测与标记。

持续学习阶段: 不过利用新数据与行为进行模型校准是实现成功的关键所在。

除了机器学习，保险公司也在越来越多地利用图像分析机制以获取欺诈模式的可视化能力。

亦有很多保险公司将图像分析与Apache Spark/GraphX加以配合，其可同时利用神经网络与社交网络实现欺诈性索赔分析。这类方案能够有效降低传统评估中过高的误报率。

图像分析技术能够帮助大家理解数据关系并用于调查个别索赔欺诈案例，最终让保险公司更快实现欺诈模式可视化。

原文标题：Machine Learning and Its Impact On the Future for Insurance，原文作者：Cindy Maike

【51CTO译稿，合作站点转载请注明原文译者和出处为51CTO.com】