人工智能在过程工业绿色制造中的机遇与挑战-人工智能机遇与挑战

一、引言

过程工业是原材料工业的一个分支，对国民经济具有重要意义。经过数十年的发展，中国的过程工业取得了长足的进步，中国成为世界上比较大的制造业国家之一。然而，与发达国家相比，中国的过程工业急需智能管理和营销技术来提高原材料的利用率，同时建立更加实用的环境和安全管理体系。这一问题引起了学术界的广泛关注，并在相关研究领域取得了很大进展。

[[325355]]

近年来，新一代信息技术的迅猛发展，促使一些国家寻求新的产业革命战略(图1)。美国推出智能流程制造，旨在产业升级和转型。德国提出了工业4.0的战略构想，重点是将信息技术融入制造业。英国、法国和日本分别宣布了英国工业2050战略、法国新工业计划和日本社会5.0战略。在此背景下，中国政府为实现“新工业革命”，提出了《新一代人工智能发展规划》。《新一代人工智能发展规划》战略以“创新、协调、绿色、开放、共享”为核心，推动智能制造发展。

图1. 各国为应对新工业革命提出的政府计划

在国家应对新工业革命的战略背景下，智能制造是当前过程工业的发展趋势，绿色制造是其不可或缺的组成部分之一。绿色制造注重高效和安全，这反映了更严格的环境政策和更好的事故预防的需要。实现绿色制造需牢记三个主要目标：降低能源消耗和减少污染物排放;生命周期过程安全监测和风险控制;以及环境足迹监测和评估。到目前为止，还没有很好理解的方法来实现这些目标。

人工智能(AI)是一项综合性前沿技术，因其在AlphaGo中的出色表现而受到全世界的广泛关注。今天，人工智能被认为是世界上最先进的三大技术之一，并对计算机视觉、自然语言处理和机器人技术等多个领域产生了显著的影响。此外，人们普遍认为人工智能对智能制造至关重要。

本文详细讨论了绿色制造在过程工业中所面临的挑战。人工智能通过对材料和能源的智能利用，在改善过程安全管理和提高效率方面发挥着重要作用。本文的其余部分介绍了将人工智能融合到过程工业中现存的技术挑战。

本文的主要贡献如下：

(1)总结了中国石化行业过程安全的现状，指出了过程工业实现绿色制造的主要问题;为绿色制造提供了重要的指导方针。

(2)针对中国石化行业的现状和主要问题，提出了我们的观点：人工智能是实现绿色制造的核心技术。为了实现绿色制造，有几种技术可以解决这些主要问题，包括知识图、贝叶斯网络和深度学习。

(3)考虑到过程工业与过程工业特点之间复杂的安全关系，提出了将知识图应用到过程工业的若干技术挑战。这些挑战可能会引起未来研究人员的兴趣。

本文的其余部分组织如下。第2部分阐述了过程工业绿色制造的现状和问题;第3部分阐述了与绿色制造相关的潜在人工智能技术;第4部分介绍了与绿色制造中的人工智能相关的几个技术挑战;第5部分讨论了最近的进展与未来的前景，最后一部分是总结和展望。

二、绿色制造的现状与问题

(一)绿色制造

人们普遍认为，制造业已经经历了三次工业革命，现在正在经历第四次工业革命(图2)。前三次革命都极大地促进了生产力和经济发展。因此，人们普遍认为，被称为“智能制造”的第四次革命也将做出这样的贡献。

图2. 四次工业革命

石油和化学制品是过程工业的重要组成部分。根据中华人民共和国国家统计局的数据，石油化工业已成为中国国民经济的支柱产业之一，2017年占工业总产出的12%。石油化工行业在为中国国民经济发展做出巨大贡献的同时，由于长期的污染影响和频发的事故，也给公众健康和环境安全带来了负面影响。在信息时代，工业事故通过各种新闻渠道和社交媒体被报道和传播到世界各地，使公众知情并关注。这促使政府制定更严格的行业标准和法规，从而增加了绿色制造的需求。最近的重大事故，如响水“3·21”化工厂爆炸事故、天津港“8·12”火灾和爆炸事故，和青岛“11·2”原油泄漏和爆炸事故，不仅造成了严重的人员伤亡、巨大的经济损失、严重的环境影响，也对石油化工产业的发展产生了负面效应。江苏省政府计划到2022年关闭一半以上的现有化工企业。

除了过程安全之外，石化行业的环境影响——包括短期影响和长期影响——也值得关注。与离散制造相比，中国的过程工业具有材料和能源效率低、污染严重的特点。鉴于中国的过程工业在国民经济中所占的规模，在环保要求日益严格的情况下，迫切需要降低能源消耗和过程排放。

绿色制造被认为是实现过程安全、能源消耗和减排的解决方案。它旨在通过集成智能监控、智能预警、智能决策和基于优化的污染降低技术，在整个过程生命周期中跟踪与安全相关的方面。绿色制造可以显著提高过程工业的安全性和效率，并有可能成为高水平经济发展的必然要求。

(二)现状和主要问题

中国石化行业的过程安全与环保能力现状可以通过以下三个方面进行阐述(图3)。

图3. 我国石化行业安全生产和环境保护能力现状的三方面

(1)大规模生产。应急管理部化学品登记中心发布的统计报告显示，2017年，中国生产和消费的普通化学品超过7×104种，其中危险化学品3962种。危险化学品是一种对人类或动物的健康、环境或财产有潜在危害的化学品。经过几十年的发展，中国已成为较大的化学品生产国和消费国之一。国家安全生产监督管理总局报告称，我国危险化学品相关企业超过3×105家，从业人员超过1×107人。管道长度超过1.2×105km。这些化学品——尤其是危险化学品——的巨大经济价值不仅使国内生产总值迅速发展，而且导致环境保护和公共安全相关问题日益严重。

(2)化工行业分布不均。鉴于中国东西方向上的人口分布和经济差异，石油和化工相关企业大多位于东部沿海地区(图4)。然而，对于特定的化学品，其生产过程生命周期、存储、运输、使用和损耗通常发生在不同的工厂、县、市、甚至省。因此，过程安全与环境保护应在更大的时空尺度上加以考虑;然而，由于不同阶段的复杂性(如材料处理和信息流)，这并不是一项容易的任务。为了解决这些问题，需要在信息集成和数据分析方面付出更多的努力，而这可以通过人工智能和云计算来实现。

图4. 化工企业在中国的分布

(3)更高的安全性和环境要求。经济发展提高了中国的总体生活水平，而环境恶化使追求更高生活质量的居民难以接受。环境问题越来越受到政府和社会的关注。公众意识的转变促使政府放弃粗放的经济发展模式，追求可持续发展。此外，“十三五”规划要求到2020年重大事故数量减少20%，相关死亡人数减少20%，从而增加了石化行业对智能过程监控和风险管理系统的需求。

除了石化工业以外，过程工业的现状与上面所讨论的也很相似。这里列出了阻碍过程工业绿色制造的主要问题。

(1)多领域间的信息隔离。在过程工业中，生产、储存、运输、使用和消耗各个阶段是相互关联的。但是，每个阶段都侧重于其特定的领域，并且有自己的信息和数据库系统。在现实中，生命周期中的过程是物理连接的;然而，从信息处理的角度来看，它们通常是孤立的。不同流程之间不恰当的信息交换阻碍了过程生命周期数据的全面分析。例如，如果在动态风险评估过程中能够考虑有关材料的信息和危险化学品运输的实时位置，那么就可以通过动态例程和应急准备来评估潜在事故的可能性并更好地管理风险。事故的可能性可以降低到一个可接受的水平，重大事故能够得以避免。因此，整合丰富的信息，建立知识基础，是过程工业实施绿色制造首先要解决的挑战性任务。

(2)信息类型多样，数据类型不同。从生命周期的角度来看，不同的阶段，如制造、储存和道路运输，都有各自的特性和专门的知识。这些差异在空间和时间维度上都存在。例如，温度、压力、水准等值很重要，因为它们包含了有关异常情况和其他质量相关问题的信息。在交通方面，路线、企业、实时位置、车辆状态、驾驶员状态是交通安全的关键。但是，这些信息属于不同的系统，很难进行通信或集成，更不用说数据采样率、数据格式和数据收集方法上的差异。这些问题对将与安全相关的信息集成到过程生命周期中造成了困难。此外，在不同的生命周期过程中收集的数据背后有不同的规程，将事实数据和知识集成到一致的系统中是另一个具有挑战性的任务。

(3)缺乏以过程安全为导向的决策体系。对于过程工业中的大规模生产——特别是石化工业——几何放大是降低成本和获得规模效益的优秀途径。大规模生产会导致复杂的供应链和标识系统。产业从一个城市、一个省向外延伸，最终在全国形成一个巨大的网络。在产业链中，不同时空区域的生产和需求需要国家运输和仓储网络，覆盖人口密集地区和各种自然环境。危险化学品的大量储存可能对当地社区构成重大风险。扩大生产的过程需要功能齐全的控制系统、正确的人工操作及高水平的机械完整性。如果不及时正确处理，任何微小的错误或故障都可能引发严重的事故。换句话说，关于风险，太多的因素是相互关联的，它们之间的相互作用通常不是直观的。

在现代石化工厂的设计中，通过整合多种实用的危险识别和管理技术，将风险管理纳入考虑范围，如危害和可操作性分析(HAZOP)、防护层分析(LOPA)和系统完整性等级(SIL)。然而，这些分析有些静态，相关的文档超出了现场操作人员的能力，他们需要充分了解情况及其行动的潜在后果。操作员的行为高度依赖于培训和管理。近日，德国巴斯夫化工公司发生事故，造成了人员伤亡和经济损失。事故的原因与工作人员的操作失误密切相关。该案例反映了建立决策系统的必要性，这对安全操作具有重要意义。因此，需要一种能够利用现有文档(如HAZOP、LOPA和SIL)中嵌入的静态知识来动态地分析情况并提供安全相关建议的智能系统。这样的系统可以在紧急情况下，比一名工人考虑更多的安全相关因素，从而改善安全管理。

安全实践的另一个关键方面是本质上更安全的设计，其概念是永久减少或消除过程中与材料和操作相关的危险，该概念在过程设计的早期阶段、正常操作和变更中得到广泛应用，直到设施的使用寿命结束。从安全的角度来看，化学过程具有结构相似性。在某一化学过程设施中应用本质上更安全的设计将为其他设施树立一个先例。为了在更广阔的视野中支持安全导向的决策，必须提取和集成本质上更安全的设计的基本规则和概念，以及从几个成功案例中获得的经验。最后，建立过程安全决策系统的一般挑战在于，用自然语言编写的人类经验和知识如何被机器理解和使用。

(4)缺乏预警和风险跟踪系统。在过程工业中，大多数事故恶化都是由于缺乏有效的警报机制。通常，石化过程以多种配置运行，每种配置都有自己的操作窗口和(或)限制。由于过程是由自动化系统控制的，过程参数的微小波动会扩散到下游过程并影响临界机组。由于过程参数之间存在复杂的内在关联，操作人员通常无法明显识别临界机组的这些变化和波动。目前，过程监控员和操作人员依靠他们的经验来解决这个问题。正确的流程运作需要一种基于复杂的过程监控系统识别异常情况的能力，以识别实际的流程配置和趋势。诊断功能应实时工作，以评估当前的风险和正常的操作配置向异常情况的潜在转移。需要一个辅助决策系统，它可以为当前的情况提供可能的原因，并描述如果不采取行动可能产生的后果。令人遗憾的是，目前还没有这样的智能系统。

三、绿色制造中的人工智能

人工智能，通常被称为机器智能，已经成为计算机科学和自动化的一个重要分支。人工智能结合了计算机科学、自动化、信息工程、数学、心理学、语言学和哲学的领域知识。AI所面临的问题根据具体的特征或功能被划分为几个子问题，如图5所示。

图5. 人工智能的几个子问题

根据绿色制造的四个主要问题的特点，可以将其分为三类：信息集成、动态风险评估和辅助决策、预警。有几种技术可以解决这些问题并实现绿色制造，包括知识图、贝叶斯网络和深度学习，下面将详细介绍。

(一)通过知识图进行信息集成

在人工智能领域，知识图是一种广为人知且很有前景的关联数据组织技术。它是描述概念及其关系的结构化语义网络。此外，知识图可以提供基于规则或深度学习策略的推理和推断能力，这些能力增强了预定义类中“实体”之间关系的含义。知识图广泛应用于基于互联网的应用，如百科全书、社交网络、在线金融系统和社会保障系统等。

与互联网相关应用程序中使用的一般知识不同，过程工业需要在化学工程、过程安全、过程控制、自动化和机械方面更加专业化。在这样一个专业化的行业中，知识图的实现不仅需要真实信息，还需要该领域的具体知识。知识建模通常是困难的，因此对特定领域的深刻理解至关重要。根据构建任意领域知识图的一般步骤(图6)，过程安全知识图的构建大致可以分为三个阶段：收集与过程安全相关的信息、知识融合和知识处理，如图6所示。

图6. 典型知识图的技术架构

(1)过程安全信息提取。知识图的构建从收集有关过程安全的信息开始，包括化学品、反应、过程相关文档、控制系统、机械信息和风险相关信息。这些信息和数据的范围应该是广泛和多样化的，不仅包括结构数据，而且包括用自然语言编写的图形、表格和文本。因为知识图的主要目的是生成关联数据，所以主要的挑战是识别来自不同数据源的个体“实体”及其关系。这些过程通常被称为实体提取、关系提取和属性提取。

实体提取：实体提取是指从文本数据集中自动识别命名实体。它是信息抽取的最基本部分。它依赖于定义良好的本体模式来提取过程工业中特定的风险相关因素。数据源通常包括操作手册和维护表，以及管道和仪表图(P&ID)、过程流程图(PFD)。

关系提取：在已提取实体的前提下，第二步是确定实体之间的关系。这种关系通常采用语义信息或其他图表的形式。在石化行业，有关因果安全方面的信息通常包含在过程危害分析文件中(如HAZOP、LOPA和SIL验证文件)。确定这些因果关系通常需要对风险有深刻的理解，或者至少知道产生危险的因素。

属性提取：与过程相关的实体，如减压阀，在不同的方面有不同的定义，包括材料和减压设计。这些属性也应该提取，因为它们包含一些可以用来比较或建模的量化信息。

(2)过程安全知识融合。通过安全信息提取，可以对风险因素及其相互关系进行完整的描述。然而，这些结果可能包含许多冗余和错误。此外，数据之间的关系是平面的，缺乏层次结构和逻辑。通过知识融合，可以自动或人工识别和消除概念的模糊性，消除冗余和错误。

(3)过程安全知识处理。知识融合后，可以消除实体的模糊性。接着，可以表达一系列基本事实。在过程安全实践中，安全相关因素的分析是非常重要的。潜在的危险和事件的可能性应该被识别和估计。为了实现过程危害的自动识别，应应用过程安全相关知识来描述每个特定化学过程的细节，包括过程、设备、可操作性和机制。应将某些过程参数的偏差定为初始事件，并使用预定义规则和嵌入式知识来诊断触发事件与下游过程之间的因果关系。知识处理应该为自动安全分析提供这样的能力。

知识处理主要包括三个方面：安全本体重构、推断和质量评估。

安全本体重构：本体是指对客观世界中的概念进行建模和描述的标准。本体以一种正式的方式明确地定义了某些领域的知识概念及其联系。过程安全本体可以通过现有知识的头脑风暴初步构建。一旦收集到足够的关联数据，就可以利用机器学习方法从数据共同特征中重构出相应的本体。

风险关系推断：推断是指根据预定义规则或数据中已有的特征，发现现有实体之间的潜在关系。通过知识推理，可以从现有的实体网络中发现或估计新的过程安全知识。现有的危害识别和分析方法已经提供了各种偏差之间关于风险度量和因果关系的信息。从理论上讲，使用过程安全知识图进行推断可补充识别未被识别的风险相关因素，从而提高操作安全性或功能安全性。推理方法可分为两类：基于逻辑的推理和基于图形的推理。

质量评估：这对于构建流程安全知识图也很重要。使用最先进的知识提取技术，从数据中获得的事实和知识可能仍然存在错误和干扰。自动知识提取和推理不能保证安全相关知识的质量。在将新提取的数据与领域知识图谱合并之前，需要进行质量评估，以评估新获取数据的精度、查全率和F1分数(精度和查全率的加权平均值)标准。

总之，知识图提供了一种有效的方法来集成过程工业的相关信息。隐含在数据中的信息沟、数据发散、复杂关系表达等现有问题都可以通过知识图来解决。

(二)使用贝叶斯网络进行风险评估和决策

贝叶斯网络是一种概率图形模型，它使用有向无环图来捕获变量之间的概率关系，并捕获变量的条件依赖关系。在过程工业中，风险因素可以用概率关系与不同类型的异常和反常相关联。

例如，假设焦炉(一个延迟焦化反应器)内存在反应失控的可能性，考虑到反应的危险性，需要分析5个主要的过程参数。这些参数是：①和②热料的温度和流量，③和④被加热材料的温度和流量，以及⑤炉管中的结焦度。所有这些参数都有不同的偏差概率。贝叶斯网络能够描述上述5个因素与失控反应之间的复杂概率关系。该方法也可应用于其他潜在事故及相关危险因素上。考虑到准确性，贝叶斯网络中的参数应该仔细调整以获得良好的性能。因此，可以根据最大熵原理对基于现有先验知识得到的参数进行优化，并使用极大似然法进行估计。然后，贝叶斯网络可以准确地追踪风险因素。

如前所述，通过综合分析数据，贝叶斯网络能够找到一个异常源来估计焦化炉是否会发生失控反应。此外，利用过程安全知识图提供的关联数据，贝叶斯网络可以针对不同的异常情况提供应急解决方案。

(三)基于深度学习的事件预警

深度学习，也称为深度结构化学习，是机器学习的一个子类。它模仿人脑的功能，利用多层神经网络来解释数据。在过程工业中，潜在事故的可能性通常隐含在流程监控数据的波动中。

例如，向放热反应进料的成分变化可能导致反应器内产生更大的热量，从而缩小适用的操作窗口。因此，过程参数的波动可能超过安全限度，导致温度迅速升高、反应失控。如果上游机组的温度/压力升高与下游机组潜在的爆炸后果之间的关系在爆炸发生之前就已经确定，则可以设计一个特定的预警功能。不幸的是，在现实中，流程监控参数的数量太多，而参数变化与潜在风险之间的隐含关系又太复杂，人类难以掌握。在这种情况下，深度学习可以用来识别潜在事故的模式和相关的参数变化。此外，如果可以获得贴标过程监控数据、过程设备和人工操作的详细信息，就可以从测量数据估计潜在事故的概率。带标签的大数据是风险识别、评估的深度学习及其相关技术的基础。但是在实际情况中，从流程中收集到的大数据往往存在缺失数据和异常值，缺少经过验证的标签。因此，获得的数据往往不够充分，目前工业应用中的事故预警主要依赖于专家经验和报警系统。

四、技术挑战

虽然知识图已经在一些特定的行业中得到了应用，但它在制造业中仍然是一种新的技术。考虑到过程工业中复杂的安全关系，知识图在过程工业中的实现仍然面临几个技术挑战，如下所述。

(1)过程安全稀缺标签的知识获取。稀疏采样环境下的知识获取是建立知识图的常用步骤。当将其应用于过程工业时，由于化学过程的复杂性，可能会遇到一些困难。过程安全应用是一个生命周期过程，它要求流程设计、设备、自动化和人工操作具有完美的功能。如果任何一个发生故障，事故就有可能发生。然后，为了构建描述过程安全相关信息的知识图，需要提供丰富的相关数据。但是，对于化学过程的生命周期来说，这些相关的数据往往在不同的领域，获取这些跨学科的数据是很困难的。此外，在过程安全分析中，最有价值的数据是在异常情况和故障情况下，带有标签的过程监控的实时变化。然而，这些标签在过程安全分析的应用中通常是不可获得的。

(2)基于知识的过程安全推理。由于过程工业迫切需要降低风险和安全操作，因此过程监控、异常情况跟踪和后果评估应及时、可靠。知识推理可以揭示一些对人类来说不明显的因果关系，从而为过程安全分析提供补充信息。目前，最好的知识图推理方法已达到80%左右的准确率;然而，这一水平对于过程安全分析的实际应用是不够的。应改进现有的知识推理技术或提出新技术，以满足过程工业的安全要求。

(3)多源异构数据的精确融合。在过程工业中，与过程安全相关的数据有两种形式：静态形式和动态形式。静态数据包括不经常变化的过程信息和相关的危害分析文档，而动态数据主要描述时刻变化的过程状态。然而，在实际应用中，获取的数据往往存在歧义，增加了获取知识的难度。有两种可能的解决方案，前者侧重于数据预处理，后者强调基于领域的知识获取，并对获取的数据进行知识融合。

(4)动态风险评估和辅助决策的有效学习策略。知识图提供了一种有效的方法来整合静态知识和与石化过程安全相关的事实。在理想的情况下，化学过程中的因果关系应该保留在不同实体之间的关系以及相应的规则或公理中。虽然知识图能够从特定的偏差中进行因果分析，但是适当的偏差本身通常很难识别。过程监控系统的实时数据是识别可能偏离正常状态的必要条件。利用知识图，需要合适的机器学习方法对异常情况进行分类。然后，使用一个推理引擎，可以评估某个偏离初始状态的动态传播，并且可以为不同的结果识别多个事件链。最后，对每个事件链进行动态风险评估，做出最终决策。为了达到这一目的，需要在过程可靠性、设备故障模式和相应的影响、操作程序等领域提供丰富的信息。令人遗憾的是，在实践中，高质量的数据远远不足以确保算法学习。挑战在于处理小样本数据。

五、目前及未来的工作

为了通过人工智能实现绿色制造，我们已经开始了延迟焦化反应过程安全知识集成的研究。目前的结果如图7所示。图中提出了一个集成的本体，包括延迟焦化过程中的设备、化学过程和化学物质。在知识图中，考虑了与过程安全相关的每个元素，包括过程参数的上下界、上下游关系、过程参数偏差的构成。我们还专注于可视化与问答，并取得了相应的结果，如图7所示。实现可视化和问答的目的是提高人机交互能力，这是实现智能制造的重要组成部分。

图7. 当前和未来工作的框架

今后，我们将重点研究任意偏差及其对下游过程参数的影响之间的因果关系。初始偏差向下游传播，形成事件树，随后对其进行分析，以支持决策。其目标是通过使用适当的过程监控技术来识别异常情况，并通过自动跟踪普通故障树和事件树来实现快速逻辑分析。此外，随着知识图中的集成数据的深度和广度增加，在我们未来的工作中，将通过深度学习和贝叶斯网络来实现事件预警、风险跟踪和辅助决策。

六、结论

本文详细论述了绿色制造在过程工业中的重要性、现状及面临的主要问题。我们回顾了人工智能领域的几个有吸引力的技术，包括知识图、贝叶斯网络和深度学习。这些技术为解决绿色制造中的主要问题提供了方法。在充分分析和讨论的基础上，论述了工艺安全面临的具体技术挑战。这些挑战包括对稀缺错误数据的知识获取和推理、异构数据的精确融合以及早期预警和辅助决策。提出了应对这些挑战的可能途径，并讨论了相关成果。