机器学习解决工业4.0的易变性、不确定性、复杂性和模糊性问题-51CTO.COM

前言

科技的突飞猛进使工业4.0时代即将到来，然而现实发展仍存在许多风险因素。本文首先分析了工业4.0时代的易变性、不确定性、复杂性和模糊性问题。这四个风险因素源于宝洁公司提出的VUCA战略，这里的VUCA是它们的英文首字母，该战略被广泛用于行业分析之中，目的是根据预期目标提出解决风险的措施。利用机器学习，是解决工业4.0时代的VUCA问题的最佳途径。

工业4.0时代到来

工业4.0最初在2011年由德国提出，是指为促进工业制造数字化而制定的高科技项目战略，从而打造完全自动化的制造行业。目前，工业4.0已经应用了最先进的科学技术：云计算、物联网、大数据、射频识别、协同开发等。其中以物联网技术和大数据技术最为知名。

(1)物联网技术与工业4.0

物联网(Internet of Things，简称IoT)最初由美国麻省理工学院工业自动识别中心的创始人凯文阿什顿在1999年提出，指将一切通过高度智能化的交互系统连接，从而形成自动化的世界。这里的“智能”指利用先进的通信和互联网技术，有效处理信息，并形成“智能产业”。物联网设备之间的交互动作，让它们彼此获得信息，使得设备自身可以监控业务流程、提高生产效率，进而节省成本，做出更好地决策。

物联网技术可以被分为四个阶段：

数据传感阶段：工业生成的数据通过传感器感测，并收集传输到最近的基站等待处理;
整理加工阶段：对数据进行整理和处理，并根据需要进行相应转换;
预处理阶段：利用边缘技术处理系统在数据传输到中心前进行预处理;
存储维护阶段：生成的数据被存储维护，为后续分析建立基础;

物联网技术(Internet of Things)

物联网技术的四个阶段说明，具有高度感测技术的自动化装置是工业物联网的基础组成部分，这些智能机器的操作将增加工业生产的灵活性，影响生产者对智能管理的依赖性，并为行业发展设定新的标准。

物联网技术能满足数字市场的快速发展和消费者需求的不断增加，在不需要人工干预的情况下，及时、准确地完成分配的工作。使用物联网的行业运营效率更高，更能了解客户的需求，最终提高盈利能力。

(2)大数据与工业4.0

工业发展导致系统中出现了巨大的数据流，这些数据的保护、处理和维护成为人们关注的焦点，大数据技术(Big Data Technology，简称BDT)由此而生。大数据最初由IBM数据科学家定义而来，从字面上讲，意味着大量信息的数据集合，它是一个分析海量数据的概念。

大数据这个概念有五个维度：

体量：大数据代表数据数量上远比之前庞大;
多样：不同的数据源，生成了不同结构的数据;
速度：数据生成的速度快，分析处理的速度也快;
真实：数据的真实性是分析的前提;
价值：通过分析数据得到的行动是有价值的;

大数据技术(Big Data)

目前，大数据已经成为各种业务数字化的基础，它在收集、传输、分析和使用大量实时数据的同时，生成的信息提供了智能流程的改进思路，从而保障工业生产高效、无故障地执行。适当收集和分析大数据将提高产品制造、供应链管理、物流和风险管理等多个部门的竞争力。

VUCA战略知多少

VUCA战略指的是前言中提到的易变性、不确定性、复杂性和模糊性，最初的VUCA战略发源于军事领域，但是现在已经广泛应用于商业分析中。VUCA战略通过分析预期的发展风险因素，并对这些情况加以准备，从而在竞争激烈的商业世界中生存。因为VUCA发音近似于乌卡，所以也用“乌卡”代表。

VUCA战略具有如下四个维度：

易变性(Volatility)：指商业环境中的极端和快速变化。这些变化的速度、数量和幅度可以反映它在商业环境中的波动程度。产生易变性的原因往往是已知的，比如价格的易变性会导致供应链的风险，商品供给的易变性将导致公司无法满足消费者需求;
不确定性(Uncertainty)：由于易变性的存在，在缺乏了解的时候将会产生不确定性，从而导致未来不可预测，影响长期发展。在商业环境中，可能引起不确定性的因素包括：用户需求、偏好的变化，新政策的提出，新产品对旧产品的替代等;
复杂性(Complexity)：复杂性的产生来自两个方面，一是工业化的快速发展，使企业内部相互联系的网络和程序逐渐复杂，二是外部的商业环境的不确定性导致决策的复杂性。外包活动(如会计核算、市场营销和计算机辅助设计业务)的引入，导致复杂性更加普遍;
模糊性(Ambiguity)：模糊性表现在商业行动中无法清晰陈述、无法准确评估概率以及无法描述潜在结果的多样性，当新产品或者新计划被引入市场时，模糊性出现的可能性更高;

机器学习知多少

机器学习属于数据科学范畴，被视为一种涵盖数据处理所有方面的研究，它是人工智能的一个分支，赋予机器自主学习的能力，而不需要人工干预。机器学习使计算机不需要人工编程，就可以自动化地执行任务。

机器学习技术(Machine Learning)

机器学习的流程如下：

1.数据收集：这是机器学习流程的第一步，也是最重要的一步。计算机根据问题陈述收集相关数据，这些被收集的数据被称为训练数据，它们应当准确完整，以便解决问题;

2.数据预处理：预处理是为了将采集到的不完整、不一致和错误的数据转换为可行的数据，以便更好地拟合机器学习模型。在除去了数据集的问题后，数据的特征将被提取出来，并用于模型训练;

3.模型构建：选择适当的机器学习技术来获得预期结果的过程。机器学习的模型种类很多，总体可分为有监督学习、无监督学习和强化学习三种，不同的技术适合处理的问题不同;

4.模型训练与测试：在确定选择哪种模型之后，预处理的数据集会被分为训练集和测试集两个部分，分别满足训练和测试两种要求。模型训练指利用机器学习技术将模型评估的误差降到最小，当模型训练完成后，它就被用于测试数据集中进行测试工作，以评估模型的效率和准确性，测试的结果会由一些评价指标进行反映;

5.性能评估：利用交叉验证、参数调整和多种机器学习算法，尝试得到效果更好的算法，或者使用组合方法将多个算法的结果组合起来;

6.模型执行：执行模型输出结果，以便在未来利用模型完成机器学习任务;

那么，机器学习是如何对VUCA战略进行解读的呢?由于不同的VUCA战略所要实现的目标不同，这就涉及到了一些具体的机器学习算法。

机器学习让计算机拥有智能

机器学习解读VUCA战略

在这一部分中，作者会介绍几种常用的机器学习算法，简要描述它们的原理，并举例说明它们在工业4.0的VUCA战略的现实应用。

(1)线性回归模型：线性回归是回归算法中一种有监督的机器学习算法，它根据给定的变量来预测结果，得到两者的线性关系。常用的线性回归模型有两种，分别是单个变量的简单线性和多变量的多元线性回归。

线性回归模型主要解决VUCA战略的易变性和不确定性问题。谷歌公司的应用软件已经利用线性模型分析特定道路的历史数据，来预测交通状况。一些金融从业人员利用波动率指标建立线性模型来预测金融市场的波动性，并证明该方法优于传统的移动平均法。

(2)Logistic回归模型：是分类算法中一种有监督的机器学习算法，以给定的变量作为输入值，以0或1、是或否、真或假等离散值预测输出结果。虽然是回归模型，但解决的是分类问题，通过给出预测得数据所属类的概率来完成判别。

Logistic回归模型主要解决VUCA战略的复杂性和模糊性问题。医疗行业用这个方法将病人分为关键诊断和非关键诊断类别，金融行业据此建立预警模型，根据过去的债务、违约情况和收入，判断用户是否会在业务中违约。这种算法有效地处理了复杂和模糊的风险因素，预测结果具有较高的精度。

(3)决策树模型：一种有监督的机器学习算法，分为分类算法和回归算法两类。数据集被分为具有相同类别的较小部分，直到所有的数据都被分类，且节点是最终的决策节点。决策树由熵、信息增益来构成，以预测事件的不确定性程度。

决策树模型主要解决VUCA战略中的不确定性和模糊性问题。例如，大型工业项目由于规划设计复杂，且参与的群体多样，存在很大的不确定性，利用决策树模型可以对这些不确定因素进行分类，提前预测风险。

(4)随机森林模型：一种有监督的机器学习算法，通过随机收集决策树来预测期望的结果，从而创造“森林”，随着决策树生长，每个决策树都可以对新对象分类并投票，最高票数将对随机森林的过程分类。

随机森林模型主要解决VUCA战略中的模糊性问题。它有助于估计公司不稳定的业务绩效指标，如预测机械零件故障的可能性、估算市场的盈利能力并最小化风险，在预测灾害损失方面也有应用，且效果优于其他机器学习算法。

(5)支持向量机模型：分类算法范畴下的有监督机器学习算法，通过生成一个平面或者决策边界将样本分成不同的类，数据样本点根据不同的特征进行分类，每个点都有不同的坐标作为支持向量。

支持向量机模型主要处理易变性、复杂性和不确定性问题。供应链管理系统的需求预测、工业材料风险对冲模型等都涉及到了这些内容。

机器学习多种技术模拟决策

总结

工业4.0通过物联网和大数据技术实现自动化数据交换，通过云计算实现数据存储和处理，通过认知计算帮助人类决策。它降低了人力成本，简化了业务流程，提高了生产预测的准确性。这些改进将显著提高生产效率和收入，有助于经济增长。

然而，工业4.0的进程中仍存在易变性、不确定性、复杂性和模糊性问题，这些问题影响了工业发展进程，需要得到合理的解决。机器学习技术可以让智能设备在不需要人工编程的情况下做出决定，从而减少不确定因素导致的风险，在未来将被广泛应用。