预测性维护怎么玩之科普篇

2021年10月20日 101 次阅读 本文共2464字,预计阅读时间8分钟

引言

预测性维护可以算是智能制造中比较火的应用场景了,其中涉及了以机器学习为核心的众多先进技术。在这里做个科普讲座,希望通过本文能够帮助大家了解设备预测性维护的总体过程和原理。

什么是预测性维护

首先看一下设备维护的四种方式,如下图:

设备维护的四种方式
设备维护的四种方式

设备维护的发展阶段

在这里,我们所要讨论的预测性维护指的是利用设备运行的状态信息、环境信息等各种数据,主要基于数理统计模型,对故障进行预测。

预测性维护的重要意义在于避免过度维修,节约设备维护成本。

预测性维护的实施步骤

前提条件

要有一定的数据积累。

这里所说的数据积累包括两个方面:数据的种类和数量。

在种类方面,至少要有两类数据才能够进行预测模型的建立和训练,即故障数据以及设备运行的状态数据。在建立和训练模型的过程中,前者是模型的输出,后者是模型的输入。

在数量方面,究竟多少的数据量是足够的呢?

答案可能会让大家失望——在没有建立和测试任何模型之前,是没办法确定最终需要多少数据的,而且在这个阶段几乎也没有太多简单的经验规则可以参考。

因此,对于数据量来说,只能是多多益善。并且,我们能够确定的是,某些数据是需要尽可能多的数据量,比如,设备的故障数据、在设备发生故障之前的一定时间窗口内的设备状态数据(电压、电流、振动等等)。

不同的预测结果及建模方法

预测的结果可以分为以下两种:

  • 离散型的预测结果,即结果为一系列有限的值之一,比如“是”或“否”。例如,在未来的一定时期内,设备是否会发生故障。这里将采用分类模型进行建模。
  • 连续型的预测结果,即结果为一个数值。例如,设备会在未来的什么时间点发生故障,或者说,设备剩余有效使用寿命是多少。这里将采用回归模型进行建模。

相比于回归模型,分类模型虽然给出的预测结果相对简单,只有“是”或“否”,但是所需的数据量也要少一些。

模型的评价指标

对于回归模型,可以采用均方根误差Root Mean Squared Error作为评价指标:

回归模型
回归模型

均方根误差

对于分类模型,可以采用准确率(accuracy),召回率(recall)等作为评价指标,大家可自行百度一下具体定义。

注:准确率描述的是如果这个模型总共做了N次的预测,那么共预测对了多少次,召回率描述的是在实际发生的N次故障中,该模型共预测对了多少次。当然,这两个指标最后都是用比率来显示的。

预测性维护建模的过程

预测性维护的建模过程与一般的预测分析是一样的。

假设我们已经搜集到了一定量的历史数据,包括故障数据以及设备运行状态的数据。下面以回归模型为例,对预测模型的建模步骤进行简要介绍。当然,这部分核心工作就需要我们的数据科学家登场了。

在实际应用的过程中,下图中虚线框中的几个环节会迭代进行,直到获得符合期望目标的预测模型。

 预测模型
预测模型

建模过程

1、选取模型

数据科学家首先会使用各种算法模型进行尝试,对我们已有的数据进行拟合。在这个阶段,一般会先从简单的模型开始尝试,比如线性模型等,并以此作为与其他模型比较的基线。

这里需要注意的是,“选取模型”、“数据预处理”、“特征工程”、“超参数优化”这四个步骤并不是瀑布式进行的,而是迭代进行的,最初选定的模型也有可能在后期发生改变。

2、数据预处理

这部分工作的目的是,将原始数据转换成模型输入所需要的数据格式,包括对各类数据的度量单位的统一,或一些明显有问题的数据的排除等等。当然,有些预处理工作也可以在模型选择之间进行,比如对误差数据的排除。

3、特征工程

如果我们把模型简单理解为一个函数表达方式y=f(x1、x2、x3…..)的话,那么,特征就是其中的自变量x1,x2……。

特征工程可以理解为对模型输入变量进行处理的过程。这个处理的过程分为两种:

一种是增加特征,也就是在原有的原始变量的基础上,再应用各种方式生成新的自变量,比如x1和x2的平均值。但是,需要注意的是,生成的新的变量一定是在预测性维护的场景中有实际意义的。这就需要相关业务知识做基础了。

另一种是减少特征。例如,应用设备方面的知识,在众多的输入变量中选择出与预测结果有密切关系的自变量。

4、超参数优化

超参数的优化就是对我们所选取的模型的一些参数进行优化,使模型的预测性能指标更精确。

如果说特征工程是对自变量x所做的工作,那么超参数优化就是对函数f做的工作——调整f的各种参数。

5、模型评估

在根据历史数据建立好模型以后,我们需要对该模型进行评估,也就是用另外一些在建模过程中没有使用过的数据进行模型测试,看看预测的效果到底怎么样。这部分测试模型的数据是一般在建立和训练模型之前,从历史数据中划分出的一部分数据,通常叫做测试集数据。

6、模型部署

模型建立好之后需要部署到实际的生产系统中运行,不断地接收从设备层采集到的数据,进行预测分析。

模型的部署涉及到了工业现场的数据采集、企业服务总线等技术。

预测性维护与基于状态维护的关系

可以将二者相结合,共同发挥作用。

“预测性维护”是基于数理模型的,完全是从数据出发建立模型。而“基于状态维护”是基于设备机理模型的,依靠的是对相关领域知识的理解。因此,两者充分结合,往往能够发挥更好的效果。例如,在特征工程中,往往会利用机理模型,也就是设备的领域知识来产生有实际意义的新特征,加快模型建立与训练的过程。

目前做预测性维护的困难

最大的困难是工业现场数据的缺乏。

建立及训练预测性维护的模型至少需要两类历史数据——故障数据(即计划外停机的数据)以及设备运行状态数据(例如电压、电流之类)。并且这两类数据的数量要足够大,这样训练出的模型才更为准确。

但是很多设备的停机故障发生概率很低,可能一年也没几次,因此,这类数据的收集就需要很长时间。此外,很多工业现场并没有完善的设备数据采集系统,或者即使有一些SCADA之类的系统,也更多是完成实时状态监控,对于设备运行的状态数据,只保存了很短的时间(如3个月),缺乏设备数据的长期保存。

参考资料

本文参考了书籍《预测分析:R语言实现》,以及一篇文章《Machine Learning Techniques for Predictive Maintenance》。

上一篇:

下一篇: