工业物联网作为制造业智能化的核心部分被称之为智能制造的神经系统。而工业大数据又是智能化的来源,未来制造企业的运营过程,或者说产品的全生命周期都将由大数据串联起来。那么大数据和工业物联网是如何共同助力企业实现智能智造呢?
第83期【智造+V课堂】分享嘉宾:北京寄云鼎城创始人兼CEO时培昕博士,作为互联网专家,时博士就“工业大数据和工业物联网如何助力企业实现智能制造”的主题带来精彩分享!
分享嘉宾
北京寄云鼎城创始人兼CEO 时培昕
1. 个人简介
- 北京寄云鼎城科技有限公司创始人兼CEO;
- 企业级云计算联盟 副秘书长;
- 2003年毕业于北京邮电大学,信号与信息处理专业博士;
- 2003年-2005年,北京万林克通信技术有限公司任硬件经理;
- 2005年-2013年,汉柏科技有限公司联合创始人、历任研发总监,研发中心总经理,战略产品中心总经理,海外技术总监,汉柏研究院院长;
- 2012年,任《信息安全与与技术》杂志编审委员会成员 。
2. 行业成就
- 时培昕博士是国内最早从事云计算和大数据相关领域研究的人员之一,拥有长达15年的管理和创业经验。
- 目前带领所在公司团队研发的寄云工业物联网平台的发布填补了国内该领域的空白,是国内******、拥有独立自主产权的平台。
- 在汉柏工作期间,组建研发团队,开发包括防火墙、安全网关、防火墙、流控,此外负责新产品策划和大项目支持,承接过多个大型云计算数据中心和大数据项目的设计和建设,对计算机网络、网络安全、计算和存储、虚拟化、云计算以及大数据有着多年丰富的项目咨询和实施的经验。
- 凭借多年企业市场的产品开发和服务经验,以及雄厚的技术积累,时培昕博士率领众多技术专家和行业专家,发布了从设备端到服务器端的整体工业互联网平台解决方案,包括工业网关、工业物联网平台、工业大数据平台和工业云平台。
3. 荣获奖项
- 2015年4月,荣获商业伙伴颁发的方案商创新人物奖;
- 2015年12月,荣获赛迪网颁发的2015 SaaS行业***影响力人物奖;
- 2016年4月,再次荣获商业伙伴颁发的2016中国方案商***人物奖;
- 2016年9月,荣获云鼎奖-中国***影响力人物奖;
- 2017年4月,入选2017未来人物100名;
- 2017年4月,连续第三次荣获2017中国方案商精英人物奖;
分享主题
《工业物联网和工业大数据助力企业实现智能制造》
原文实录
原文实录context:
先简单介绍一下寄云科技,寄云科技还是一个比较年轻的公司,我们成立4年左右的时间,我们主要是在给大型的工业企业的客户和一些不同行业的企业提供数字化转型的解决方案,我们更关注怎么用先进的IT技术去解决一些OT的问题。我们现在的业务单元主要是在北京、上海和西安三个地方,我们服务的行业也包括轨道交通、电力能源、航空航天,还有包括一些装备制造。
现在各方面都有一些非常多的新技术出现,会给整个工业带来一些新的冲击。这里面我们看得见的,跟工业紧密相关的是一些新的技术,包括工业物联网联接不同的工业设备,采集工作设备传感器的数据实现边缘计算,也包括工业大数据,通过存储海量的历史数据,实时地分析海量的工业数据掌控设备当前的状况,洞悉设备历史的趋势。
同时,也会包括一部分人工智能的话题。比方说,怎么去找到问题的相关性,怎么从历史数据里面去学习一些异常的模型来去实现对当前状态的一个判决。包括怎么对一些关键指标实现人工智能的一些预测和判决。云计算主要是指能够提供很多便利的一些手段和便利的一些资源,包括怎么在任何时间、任何地点来使用,以及怎么去弹性扩展、按需使用的一个方式。
从大的角度来说,大家也都理解未来的制造一定是一个数据驱动的智能制造。左边这张图其实是一个大家比较耳熟能详的一套数据流程,但是它是以控制为目的的,从传感器的数据采集到PLC这种控制系统,实现简单地一些存储和一些告警,然后再上到生产管理系统,再上到企业的经营管理系统,一直到上面最上层的决策系统,所以它实现的是从最原始的数据到到***层价值的一个体现。
其实我们看得见是从最原始的数据到最终展现,它是需要一层一层往上传递的,但原有的系统由于它是以控制为目的的,所以它在以数据采集,包括数据分析都是以控制为目标的,实现的数据采集的量,包括准确度,包括范围可能都有一些限制。
我们现在看得见更多还是希望通过这些原始的数据能够发现更多的价值,这个价值包括一些设备的故障诊断,包括性能的优化,包括能效的一些分析,这些价值的原始数据都是来自于最原始的控制系统和传感器的这些数据。
关于工业企业的大数据平台,我这里给了一些规划的建议图,大家可以做一些参考。其实左边这一列是大家都比较熟悉的一些,从最基本的生产作业的管理MES、DCS、FCS这些控制系统里面做的一些控制逻辑提取来的数据,再上升到企业的经营管理、运营管理的过程中,需要的供应链管理,相应的决策经营管理,包括整个物料的管理。再上到最上层其实就是相当于企业内部流程的管理,包括财务,包括人事,包括绩效这些。但这些业务系统其实跟我们要做的工业大数据分析并不冲突。我们更多还是希望从左边业务系统和控制系统中,从更多地维度来去提取有效的数据,来形成右边工业大数据的一个平台,把它所有的数据注入到我们一个大的平台里面,采用不同的模型,建立不同的指标,包括基于不同主题来去构建相应算法和模型来实现可视化。
通过这种数据分析能创造什么样的价值?可以用在哪些应用场景呢?我们看得见,主要还是在三段:设计、制造、运维。
在设计端其实大家讨论得比较少,主要还是针对一些提升设计质量,包括一些模拟仿真,包括实验数据管理这些,我们接触得也相对比较少一点。我们在做的更多一个范畴其实还是集中在后面两块,制造和运维。在制造这一端,我们可以从很多的生产数据里面提取出来有效地数据来实现一些质量的改进,产线地优化,包括一些供应链协同的,包括效能提升的一些事情。
在运维端主要是针对一些大型地工业设备,其实我们现在在提的比较多PHM,也就是预测和健康管理。通过采集这种大型工业设备的运行数据来实时地评估设备当前的工作状态,以及提前的预警来保证这种大型装备不要出故障,不要出现一些非计划的停机,最终实现效能的提升,这是运维端要考虑的事情。我就拿几个例子来简单给大家展开分析一下。
***个例子,其实是我们在做的一个整车厂质量追踪的问题。这个整车厂其实是在生产的过程中发现有一些问题,它因为从上游的零件大概过了三天之后才能到总装的车间,但是到了总装车间的时候会发现有一些部件缝隙过大的情况,但是因为它在整个生产流程的过程中,上百个环节里面,都按照标准的SOP的方式来去操作,所以它非常想知道最终缝隙过大的情况到底是由什么造成的。我们找客户摇了整个生产过程中产线采集下来的数据,总共9个测量的参数和不同维度的一些数据。
这一块其实有9个测点,每个测点大概有X、Y、Z,三个不同方向的一些误差测量。我们其实也是把这些数据采集下来,首先做了一个前后的对齐,因为它有不同批次。之后我们又做了一个关联矩阵的分析,找到最终的测量数据是和之前的哪一个测点的数据是相关的,最终得到了一个判决结果,也就是导致缝隙过大的质量问题其实是由三个测点的数据造成的。对于客户来说,你在整个三天的过程中,你只要能够实时地监测这三个测点,而不用监测全部九个参数,构建一个异常模型,就可以监控加工过程的质量。一旦我们实时的数据跟这个模型出现一些偏差,我们就可以提前预知到这个设备已经出现了缝隙过大这样的情况,我们就可以提前把这个设备给停下来,而不用到***一步才采取措施。
第二个案例,风力发电机叶根螺栓断裂的分析。风力发电机大家其实也都知道,一般都是在野外几百公里之外,客户每巡检一次他都会发现风力发电机的叶片有一些都已经掉下来了,但什么时候掉的,其实他并不知道。
有些叶片都已经掉下来了,但什么时候掉的其实他并不知道。掉的原因客户也都知道,叶片根部会有一些螺栓,螺栓在旋转的过程中都出现一些松动,当掉1-6根的时候螺栓叶片还可以修,但是超过6根之后,螺栓基本上会出现一个加速损坏的过程,直到叶片断下来。每次维修叶片的费用基本上是在几十万到几百万不等。
我们自然会想能不能给螺栓加一个传感器来监测这个螺栓什么开始断的,其实这个比较比较难。因为螺栓实在是太多了,每个风机上大概有150个螺栓,加传感器的成本是实在太高。我们就给客户建议,是不是能够通过传感器本身的风机上带来各种各样的数据来推测螺栓断裂的情况呢?正好风机现在有很多的传感器,包括机舱角度、轮毂的转速、风速、变桨角度,这些大概总共有几十个指标,我们就拿过来做分析。
我们在这上面做的事情其实就是包括下面几步了,首先我们从历史的数据里面提取一些特征,然后构建一个正常和一个异常的模型,把其他故障风机的数据输入到模型里面,来去根据模型去做判决,来去确定故障发生的时间,在这个上面去预测故障发生的未来趋势。
这张图其实是一个原始的数据。大家可以从图上可以看到,从2016年5月16日到6月15日,如果从单一变量或者组合变量这个逻辑上来说,其实你是看不出来有太大的规律,每个信号在这段时间内表现的现象前后没有什么差别。
但是我们把这个变量全部送到模型之后,我们得到的判决结果是非常惊人的。这个判决结果在我的红框这一段范围之前,大家也都看得见,这是一个1的判决,就是说明它是一个正常的状态。在红框的范围之后,是一个0判决,零判决是一个故障的状态。这个判决其实非常明显,我们做的过程其实就是拿历史数据训练出来一个故障模型,基于这个模型去对设备实时的数据进行判决,根据这个模型的判决结果和历史之间的偏差,它相应的分布来去决定这个设备当前状态是一个正常状态,还是一个故障状态。
第三个案例,我们叫做故障关联性的分析。这个案例是整车的一些维修记录的分析,我们的目标是从长达十多年的故障维修记录里面找到故障的关联关系。大家可以看左边的这个图,所有的结点代表了一种不同类型的故障,故障和故障之间会有一定的关联关系。通过调整每一个结点,你把鼠标移到这些结点之上呢,你都可以看见这个故障是和什么样的故障相关。比方说,雨刷只和玻璃相关,但是玻璃又和非常多的部件相关。在这个过程中,我们可以调整过滤的关联门限值,我们发现了最Top的两个故障是一个通讯设备的故障和一个探照顶灯的故障,也就是照明系统的故障。在原厂的设计过程中,不可能预测到照明系统和通信系统之间有很强的故障关联性。我们用这种大数据的方式帮他去找出关联关系,客户自己去找的原因,***发现其实是在组装的过程中,把不同的线捆在了一起,这就造成了它两种不同的故障之间伴随高频次发生的概率。
还有一个案例,其实也是故障分析的方式。我们其实是把大量的故障,根据他的时间轴上做了一些切片。切片然后之后,找出来每一个故障的前序和后续发生的一些事件,相当于来做故障的溯源,分析这个故障产生的路径。你可以看这张图,其实是风机故障的图,我们叫Spath。你根据最右边出现的一个故障,你可以往前去推这个故障,比方说,产生1000种这样的故障有多少个?有500个是由故障造成的?这500个故障又是由一个什么样故障造成的?你可以按照这种方式时间轴来去推测这个故障发生的路径,这其实是帮助维修和分析人员能快速来找到故障产生的原因。
前面提到的各个不同的案例,其实还是主要还是数据分析,我也是想让大家看得见,通过数据分析能够解决很多质量包括运维层面,很多我们以前解决不了的一些问题。但是这个问题怎么从数据来发现价值呢?其实它要有很长的链条,我们把它分成了几段,一个是数据采集,一个是数据存储,一个是数据分析还有性能的预测,包括应用开发出来一个可视化的应用。
我们说这几个环节大家都理解,但是是大家都会面对很多的难题。首先说数据采集,工业数据采集的时候都会涉及到不同的设备,不同的封闭的协议,不同的接口,海量的测点你怎么去采集,包括很多的恶劣的工况,你的数据怎么去传回来。
同样在工业这种传感器的数据、工业设备的数据的存储上面也存在很多问题。
***,它的测点非常多,采集的点也非常多。无论是采集的方式还是存储的介质都非常多样,同时量也非常大。对存和查的性能压力也非常大。因为海量的数据,特别是大型的设备都希望有一个长达数年的存储周期,但原有的控制系统并不是以分析为目标的,他更多是以控制为目标的,所以他采集的时间跨度都不大,这也是一个巨大的挑战。
数据分析同样面临着一些问题,不用说数据量大了,因为原来大家用的各种各样的分析,包括Matlab等,我们都把这类的分析叫截面分析,或者说对短时间离线数据的一个分析。它处理几十M到几十G这样小的、短时的数据没问题,但是如果要让他处理一个TB级别、数据维度比较多的,而且还是实时的这种数据时,基本上这类工具都没有特别好的一个办法。因此也没办法从这里面去得到一些定量的分析结果,因此这些工具都并不是为我们现在的、实时的、海量的工业数据的分析而设计的。
正是由于这些数据采集的维度比较少,历史跨度比较短,所以没有办法积累起来长期的故障模型和历史的学习曲线。因此在这上面去做预测基本上会非常难,而且很多新的算法,如今天神经网络、深度学习的一些方法,都没办法在这些原有的分析工具上得到体现。
***是应用开发,把这些我们可以看得见的分析结果,以可视化、可交互的一个应用的方式展示出来,还需要很多的应用开发工作。但是大家也都知道,工业应用本身开发的过程就是非常漫长的过程,也包括特性的迭代相对比较慢,包括架构都很落后,很多工业应用还在采用单块化的应用架构,它并不是可以支持海量数据、分布式、可拓展的这种架构,后期运维的压力也都会比较大。
前面五个环节提到了很多的挑战,我们为了解决这些问题,花了三年多的时间,开发了我们自己的NeuSeer工业互联网平台,也非常欢迎大家登录到我们这个平台上去做测试。它有非常多的算法、模型,包括开发应用的一些工具和服务。
平台也是分成三段的一个架构,在边缘端我们会有相应的工业网关,能够读取得不同的协议,然后把它的数据传到我们云端。平台可以私有化部署,也可以基于我们公有云的平台来提供服务。云端的平台会提供一些基础的数据存储能力。基于这些存储的历史数据,我们可以在上面利用我们的工业大数据分析平台和应用开发平台来构建相应的远程监控、故障诊断、故障预测的应用,***能够以不同的行业解决方案的方式给到最终的客户。
这是我们一款工业网关,它***的特点能够实现不同的工业协议的解析,我们也在不断丰富我们能够支持的协议类型。它能够提供相应的数据的采集,能够把数直接从工业协议的接口里面直接读出来,并且把它变成一个可以传输到我们的平台上来实现解析规划的协议。
这是一个架构我就不多说了,支持不同的协议,我们通过读取PLC、DCS、SCADA这样不同的业务系统,实现归一化,然后把它通过MQTT的格式传回到我们的NeuSeer平台。
在平台的数据存储上我们提供很多不同的方式,因为根据客户的不同类型可能会有不同的需求,包括文件存储,包括HDFS的文件存储,包括一些结构化数据库,还有包括我们自己开发的时序数据库。
时序数据库是我们针对海量的工业设备的数据提取、查询和展示的产品套件。这个架构大家也都可以看它本身就是一个分布式的架构,我们可以支持文件和实时的流的导入,实现数据的海量历史数据的存储,我们也可以在上面构建一些分析和定制化的仪表盘,可以做一些简单的统计分析。比方说平均值、***值、最小值,包括一些简单关联分析。针对海量工业数据,特别是带有时间标签的工业数据,时序数据库能够提供***的测点,实现读取和分析,提供很好的扩展性。
除了提供海量的存储和读取的能力我们还在上面构建了一些可以自己定义的可视化面板,用户可以根据我们大概提供的几十种的不同的模板,基于时序数据来做一些比较好的分析图表,并且嵌入到用户自己的应用里面。
关于大数据分析的平台,我们也是针对这种海量的、实时的、多维的数据来提供一个相对比较高性能、分布式的、专门的工业大数据分析平台。它是基于Spark这样架构构建起来的,并且我们增强了很多Spark本身没有的算法和模型库。
这是我们提供的一些基础的算法,工业分析里面用了非常多的一些信号处理的算法,包括去噪、差值、取样、填充,很多这类型的基础数据预处理。针对振动信号这类的分析,还要做傅立叶变化、小波变换等。我们提供了非常多的基础的数据处理的方式,并且是基于Spark架构来开发的,算法能够在可以拓展的分布式的架构上面跑,这是传统像Matlab这样的分析工具没办法实现的。同时我们也提供了很多的针对海量数据、特别是时序数据的转换工具。比方说横竖变化、平均、差值等,还有大量的自回归、神经万络算法,都是针对海量的、带有时间标签的传感器数据的算法和工具。
我们也提供一些可视化的模块,可视化开发的模块用户可以构建类似刚才我提到的相关的关联分析、故障路径的分析这样的可视化结果。其实跟以前需要自己画图这种方式不太一样,用户可能只需要调用一个平台的API,把数据送给平台,平台就可以直接能画好的结果,以一个链接地址的方式嵌入到用户的应用里面就可以了。
除了算法之外,我们还提供了一些模型,我们分为三类模型:
***类是指追溯过去,洞悉过去。这包括我们刚才提到的故障诊断。故障诊断其实就是从海量历史数据里面找到故障产生的原因,找到故障产生的路径,我们可以提供关联分析、故障路径的分析这类的模型。
第二类模型叫掌控当前、性能评估的模型,客户可以利用历史数据来去选择相应的变量,去训练出来一些模型。客户会参与到这个模型训练,指定哪一段时间是一个正常状态,我们就把所有相关的变量扔到模型里面来训练出一个正常状态。后期的所有的数据都针对于训练出来的模型来去做相应的判决,一旦出现了超出历史数据分布范围之外的一些数据,我们就认为是异常的情况。结合很多维度的分析,我们就可以实现异常检测。
基于历史数据,我们还可以实现对未来的预测,我们基于神经网络来构建这种预测模型,其实大家可以从这个图去看见,它可以很好根据你之前的数据来去预测未来信号的走向和变量发展的趋势。
我们也提供了很好的模型开发与应用的过程,客户可以在我们基于他的历史数据,来去训练出来一个模型,然后经过一些测试把这个模型发布到我们模型目录里面,算法目录里面。根据这个算法目录再把实时的数据去调取,通过API的方式扔到这个模型上做实时的判决,来实现对未来的预测。未来预测的结果还可以经过一个反馈,来去修正原有的模型,***以一个工业应用的方式实现人机交互。
***说到一些工业应用的应用开发。我给了一张框图,大家可以看见,我们把整个工业应用分成了非常多的模块。我们提供了一个框架,这个框架左边是一些工业采集的设备,这些设备包括我们自己的工业网关和合作伙伴的一些网关,只要满足我们的SDK,就可以接入。把它发到我们平台提供的MQTT的Broker上面。
MQTT的消息直接可以被应用订阅,实现实时监控。同时,MQTT的数据可以通过KAFKA再到HDFS成为一个历史数据,再变成TSDB里面的可以存的这种被检索出来的历史数据,可以再提供到我们大数据分析平台上面来去构建相应的历史模型。这些历史模型构建完之后,可以发布到我们的目录里面,然后再通过API的方式对这个应用来去调用,同时我们还提供了很多外围Service,包括账户管理,包括权限,包括数据库,包括可视化结果的呈现,这些所有外围的功能,我们都把它做成一个微服务的方式,可以极大降低的应用开发的工作量。
开发的过程中我们提供了很好的DevOps的过程,从整个应用的代码源,把代码抓下来,编译、打包生成一个部署环境。再把他扔到云端平台上来,实现一个可以拓展的架构,这都是一个自动化的过程,并且我们也提供很好的重新自动构建的过程,用户只要把代码做一些改动,它会自动来去抓起这个代码,完成整个自动编译打包、生成部署环境的完整的自动化的过程。
这个是刚才我们提到的微服务的架构。一些新的应用,我们建议尽量采用微服务的方式去构建,每个应用有自己相应的逻辑,后台每个功能模块我们都建议设计成微服务的架构,并且可以调用我们平台提供各种各样的服务接口。比方说HDFS、包括TSDB这些服务,你根本不用考虑这个服务怎么去部署,怎么去运维,你只需要订阅我们的一个服务,你就可以得到一个接入地址,你把数据扔到这个平台上你就可以存,你把数据扔到模型里面你就可以算,这个是非常方便的。
***,希望通过我们的NeuSeer平台帮助客户来实现连接、洞察和优化,通过连接来连接不同的IT和OT的系统采集数据,把设备联上来,建立一些数据标准,存储海量的工业数据。通过洞察能够对设备的质量,故障产生的原因进行深度的分析,构建可分析的指标,构建一些可视化各应用。通过优化实现我们更智能的动作,包括计划排产,包括预测性维修,包括一些质量改进,供应链优化这些。