源自:自动化学报 作者:李天梅 司小胜 刘翔 裴洪
摘要
面向大数据背景下随机退化设备剩余寿命(Remaining useful life, RUL)预测的现实需求, 结合随机退化设备监测大数据特点及剩余寿命预测不确定性量化这一核心问题, 深入分析了机理模型与数据混合驱动的剩余寿命预测技术、基于机器学习的剩余寿命预测技术、统计数据驱动的剩余寿命预测技术以及机器学习和统计数据驱动相结合的剩余寿命预测技术的基本研究思想和发展动态, 剖析了当前研究存在的局限性和共性难题. 针对存在的局限性和共性难题, 以多源传感监测大数据下剩余寿命预测问题为例, 提出了一种数模联动的大数据下随机退化设备剩余寿命预测解决思路, 并通过航空发动机多源监测数据初步验证了该思路的可行性和有效性. 最后, 借鉴数模联动思路, 综合考虑机器学习方法和统计数据驱动方法的优势, 紧紧扭住大数据背景下随机退化设备剩余寿命预测不确定性量化问题, 提出了大数据背景下深度学习与随机退化建模交互联动、监测大数据与剩余寿命及其预测不确定性映射机制、非理想大数据下的剩余寿命预测等亟待解决的关键科学问题.
关键词
大数据 / 剩余寿命预测 / 数模联动 / 深度学习 / 随机退化建模
高速列车、航空航天装备、导弹武器、风电装备、工业机器人、石化装备等现代装备在功能不断提升的同时, 正逐渐趋于大型化、多元化和集成化, 这类装备多是由机械传动系统、电磁驱动系统、运动控制系统、信息传感系统等耦合组成的复杂系统, 其服役过程受变环境、变载荷、变工况、大扰动和强冲击等因素影响, 整体及关键部件性能将发生不可避免的退化, 一旦因设备性能退化造成最终失效, 将会造成巨大的人员伤亡和财产损失. 例如, 2014年8月2日发生在我国江苏省昆山市的重大铝粉尘爆炸事故, 共造成97人死亡、163人受伤, 直接经济损失达到3.51亿元, 事后调查表明: 除尘器维护不足而造成集尘桶锈蚀退化破损是主要技术原因. 2017年7月发生在美国密西西比州的美国海军陆战队KC-130运输机坠毁事件, 造成机上16名军人全部遇难, 该事故的调查结果表明发动机螺旋桨性能退化是造成飞机坠毁的主要原因. 因此, 若能在设备性能退化初期, 尤其在尚未造成重大危害时, 根据状态监测信息, 及时发现异常或定量评价设备健康状态并预测其剩余寿命(Remaining useful life, RUL), 据此对设备实施健康管理, 对于切实保障复杂设备的运行安全性、可靠性与经济性具有重要意义. 其中, 剩余寿命预测是连接系统运行状态信息感知与基于运行状态实现个性化精准健康管理的纽带和关键, 在过去十余年得到了长足的发展, 主要技术方法包括失效机理分析方法、数据驱动的方法、机理模型和数据混合驱动方法, 如图1所示. 基于失效机理分析的方法主要通过构建描述设备失效机理的数学模型, 结合特定设备的经验知识和缺陷增长方程实现设备的剩余寿命预测. 由于实际工程设备本身的复杂性、任务与运行环境的多样性,其健康状态演化规律通常难以物理机理建模或者获得失效机理模型的代价过高, 导致失效机理方法及机理模型和数据混合驱动方法存在推广应用难的问题. 因此, 数据驱动的剩余寿命预测技术已成为国际上可靠性工程和自动化技术领域的研究前沿, 过去十余年中得到了长足发展, 在航空航天、军事、工业制造等领域具有极其重要的应用.
图 1 剩余寿命预测方法体系
伴随着先进传感技术的快速发展, 工程设备健康状态感知手段日益丰富, 为设备运行监测大数据的获取提供了更多的可能. 因此, 数据驱动的剩余寿命预测技术发展迎来了新的契机, 针对大数据处理的随机退化设备剩余寿命预测问题得到了大量学者的关注, 相关技术蓬勃发展. 在此背景下, 本文的主要目的在于面向大数据背景下随机退化设备剩余寿命预测的现实需求, 通过分析当前剩余寿命预测技术的发展动态, 旨在探究该领域亟待解决的关键问题和新的发展方向. 为此, 第1节首先结合数据特点对大数据下剩余寿命预测的研究背景、主要方法及思路、核心问题等进行了概述. 第2 ~ 5节分别分析了机理模型与数据混合驱动的剩余寿命预测技术、基于机器学习的剩余寿命预测技术、统计数据驱动的剩余寿命预测技术以及机器学习和统计数据驱动相结合的剩余寿命预测技术的基本研究思想和发展动态, 同时结合随机退化设备监测大数据特点以及剩余寿命预测不确定性量化这一核心问题, 深入剖析了当前研究存在的局限性和共性难题. 第6节针对当前研究存在的局限性, 提出了一种多源传感监测大数据下数模联动的随机退化设备剩余寿命预测问题解决思路(简称为数模联动, 这里需要说明的是, “数”是指数据退化特征提取, “模”是指所提取退化特征时变演化过程随机建模), 通过构建优化目标函数实现数据特征提取与所提取特征时变演化过程随机建模的“联动”, 并通过航空发动机多源监测数据初步验证了该思路的可行性和有效性. 第7节借鉴数模联动思路, 围绕大数据背景下随机退化设备剩余寿命预测不确定性量化这一核心问题, 探讨并提出了大数据背景下深度学习与随机退化建模交互联动、监测大数据与剩余寿命及其预测不确定性映射机制、非理想大数据下的剩余寿命预测等亟待解决的关键科学问题. 第8节总结全文.
- 大数据下剩余寿命预测问题概述
近年来, 随着无线传感、物联网等技术快速兴起与普及, 各式传感器犹如一张庞大的神经网络密布在装备内部, 实时感知装备的一举一动, 推动剩余寿命预测进入“大数据” 时代. 例如, 军事装备在国家战略安全中具有不可替代的特殊地位, 其各子系统的安全可靠运行举足轻重, 必须依靠状态监测、剩余寿命预测以及预测维护等理论与方法保驾护航. 由于需要监测的军事装备群规模大、每个装备需监测参量多、数据采样频率高、服役时间长, 所以获取了海量监测数据: 一个现代航空发动机, 每10毫秒就能生成几百个传感器信息, 每次飞行能产生TB级的运行监测数据; 现代化工业制造生产线安装有数以万计的各型传感器来监测工业装备的运行过程信息及产品质量信息, 比如大型工业机器人制造商利用云平台监控着百万台工业机器人, 实时获取机器人每个运动关节的转速、角度、位置、温度、振动等信号, 每天需要对TB级以上的数据进行处理. 然而, 这些监测大数据在为设备健康状态感知及剩余寿命预测提供丰富信息的同时, 由于设备工况多变、多源信号差异大、采样策略形式多、信息之间相互耦合、数据价值密度低, 导致数据质量参差不齐, 状态监测大数据呈现不同的统计特性. 根据监测数据呈现的特点, 图2给出了完整监测大数据和非完整监测大数据(具有碎片化、分段的、稀疏性等特征)的示例.
图 2 完整的、碎片化的、稀疏的监测大数据示例
这里完整监测大数据主要针对运行模式比较固定的随机退化设备(如轴承、齿轮等), 能够实现不间断连续监测, 监测大数据涵盖了设备从开始运行到失效比较完整的状态数据, 而非完整监测大数据主要针对受经济条件及现实监测条件限制的随机退化设备(如航空发动机、涡轮泵、配电电池等), 对这类设备进行连续监测采样是不现实的, 只能间歇性地对其监测, 得到的状态监测大数据表现出一定的“碎片化、分段、稀疏”等特点. 因此, 当剩余寿命预测进入大数据时代, 如何根据监测大数据呈现出的不同特点, 充分分析利用丰富的监测大数据资源, 从浩如烟海的数据中进行“沙里淘金”, 深度挖掘出反映设备健康状态的信息并据此进行剩余寿命预测, 是随机退化设备剩余寿命预测领域亟需解决的关键问题.
数据驱动的剩余寿命预测方法基于设备运行监测数据, 通过拟合设备性能变量演化规律并外推到失效阈值, 或建立监测数据与失效时间的映射关系, 以实现剩余寿命预测, 为大数据背景下随机退化设备剩余寿命预测提供了可行的技术思路. 然而, 剩余寿命指当前时刻到系统失效时刻的有效时间间隔, 因此剩余寿命预测实际上是根据当前得到的监测信息, 对系统将来失效事件的预测, 其预测结果不可避免的具有不确定性. van Asselt等从哲学和认识论的角度讨论了预测的不确定性处理问题, 指出预测结果具有不确定性是学术界的共识, 也是当今时代的特征. 联合攻击机F-35项目组研究人员Hess等和Smith等、寿命预测领域代表性学者马里兰大学先进生命周期工程中心Pecht教授等、可靠性领域知名期刊Quality and Reliability Engineering International主编Brombacher教授通过各种事例强调了预测不确定性的量化是剩余寿命预测从理论到应用转化的核心. 美国国家航空航天局(National Aeronautics and Space Administration, NASA)预测与健康管理中心研究规划中也将剩余寿命预测不确定性的管理列为了中心发展路线图的重要研究内容. 由此可见, 预测不确定性的量化是数据驱动随机退化设备剩余寿命预测领域的一个核心问题, 也是解决“敢用、能用” 剩余寿命预测理论技术实现实际工程设备个性化精准健康管理、保障设备长周期安全可靠运行的关键所在.
随着信息技术和传感器技术的迅猛发展, 数据驱动的剩余寿命预测技术由于适用范围广、容易实现、无需深入专业机理知识等优点, 作为其中典型代表的机器学习方法和统计数据驱动方法已获得了大量研究和蓬勃发展, 得到了学术界和工业界的广泛关注, 相关技术已经在导弹武器、航空航天、风力发电、工业制造等领域产生了重要应用[14-16]. 尽管以机器学习方法和统计数据驱动方法为典型代表的数据驱动随机退化设备剩余寿命预测已获得了大量研究和蓬勃发展, 但已有理论与方法在大数据背景下随机退化设备剩余寿命预测及其预测不确定性量化这一核心问题上, 仍然没有系统有效的解决方法, 主要体现在统计数据驱动方法处理大数据能力不足, 而机器学习方法量化预测不确定性能力不足. 因此, 通过对大数据背景下剩余寿命预测研究发展脉络的探究, 深入剖析当前研究存在的瓶颈问题, 对于促进随机退化设备剩余寿命预测技术的发展具有重要意义. 在第2 ~ 5节, 将针对当前大数据背景下剩余寿命预测典型解决思路的研究动态和存在的问题进行具体的分析.
- 机理模型与数据混合驱动的剩余寿命预测
基于机理模型的方法主要是依据失效机理构建描述设备退化过程的参数化数学模型, 结合设备的设计试验数据或经验知识辨识数学模型参数, 进而基于状态监测数据更新机理模型参数实现设备的剩余寿命预测. 典型的参数识别与更新方法包括: 卡尔曼滤波[17-19]、粒子滤波[20-21]和贝叶斯方法[22-23]等. 常见的用于剩余寿命预测的机理模型包括: Paris模型、Forman模型以及在其基础上的各种改进和扩展模型, 主要用以描述裂纹扩展和层裂增长[24-25]. 例如, Li等[26-27]基于Paris模型, 建立了缺陷增长率与缺陷面积及材料常数的映射关系, 以预测滚动轴承的剩余寿命; Li等[28]提出了Paris裂纹扩展模型, 根据裂纹尺寸和动态载荷预测齿轮的剩余使用寿命; Liang等[29]研究了基于Paris模型的滚珠轴承剩余使用寿命自适应预测方法, 即使在缺乏先验信息且缺陷增长为时变的情况下, 也能获得可靠的预测结果. Oppenheimer等[30]利用线弹性断裂力学, 对转轴建立了基于Forman裂纹扩展的寿命模型; 针对层裂增长故障, Marble等[31]开发了一种涡轮发动机轴承的层裂增长预测模型, 能够根据工况估计层裂增长轨迹和故障时间, 并利用诊断反馈进行自调整, 降低了预测不确定性; Choi等[32]考虑了由于裂纹形成和磨粒磨损引起的层裂增长现象, 提出了滚动接触的层裂增长寿命模型. 在充分理解失效机理并得到准确的模型估计参数后, 基于机理模型的方法能够实现对剩余使用寿命的精确预测. 然而, 以上现有基于机理模型的剩余寿命预测方法未能结合实际运行设备的实时监测数据, 难以准确反映设备当前运行的实际状态, 特别是在设备运行环境、运行工况发生变化时, 若不能利用实时监测数据对模型进行更新, 将产生较大的预测偏差.
为了使得机理模型能够更好地建模实际服役个体设备的性能演变过程, 将设备实时运行监测数据与机理模型进行混合, 将有助于实现剩余寿命预测准确性的提升. 因此, 机理模型与数据混合驱动的剩余寿命预测方法也得到了较多的关注和发展[4]. 最近该方面的研究包括Liao等[33]、Wang等[34]的论文, 这些研究分别针对锂电池系统和旋转机械设备, 提出了机理模型与数据混合驱动的剩余寿命预测方法. 根据机理模型与数据混合驱动实现方式不同, 可将这类混合驱动的剩余寿命预测方法分为两大类: 1)基于监测数据构建机理模型所刻画退化状态的测量模型, 运用卡尔曼滤波、粒子滤波等方法估计退化状态和机理模型参数, 然后通过机理模型预测设备的剩余寿命[12, 35]; 2)首先分别基于数据和机理模型进行设备的剩余寿命预测, 然后利用决策层融合方法实现集成基于数据和基于机理模型的剩余寿命预测[36-37]. 以上两类机理模型与数据混合驱动实现剩余寿命预测的方式各具优势: 第1种方式能够充分考虑退化状态难以直接测量的实际, 在考虑监测数据中测量噪声的情况下, 可实现隐含退化状态的估计和机理模型参数的更新, 使得最终的预测结果能够更准确地反映设备当前的实际状态; 第2种方式实现过程相对简单独立, 决策层融合的形式较为多样, 如平均法、权重平均、核回归、证据组合等, 能够集成多种方法的优势, 有助于提升预测结果的鲁棒性.
虽然基于机理模型的方法和机理模型与数据混合驱动方法得到了一定的发展, 但其成功应用的基础是可获取精确可靠的机理模型. 随着当代设备逐步呈现复杂化、非线性化以及高维化等特征, 其健康状态演化规律通常难以精确机理建模或者获得失效机理模型的成本过高. 现有研究中通过物理机理分析、理化分析、实验分析等手段获取的机理模型主要针对特定材料或对象, 这一点也可以通过当前机理模型的种类相当匮乏反映出, 由此在一定程度上限制了这类方法的广泛应用. 因此, 在大数据背景下, 通过挖掘数据中隐含的设备健康状态信息, 发展数据驱动的剩余寿命预测方法成为当前的主流和研究的焦点.
- 基于机器学习的剩余寿命预测
基于机器学习的设备剩余寿命预测主要思路是通过机器学习拟合性能变量演化规律并通过滚动外推到失效阈值以预测失效时间, 或直接建立监测数据与失效时间的映射关系实现端到端的预测, 基于此通过预测的失效时间减去当前运行时间得到剩余寿命的预测值. 裴洪等[38]和Khan等[39]分别综述了机器学习方法和深度学习方法在剩余寿命预测与健康管理领域的研究应用现状. 为区别于以上综述中介绍的工作, 本文重点结合最新的研究进展和大数据下剩余寿命预测的现实需求, 对基于机器学习的剩余寿命预测技术发展动态和存在的问题进行分析. 根据机器学习网络模型结构特点, 这类方法主要分为基于浅层机器学习的方法和基于深度学习的方法.
3.1
基于浅层机器学习的剩余寿命预测
基于浅层机器学习的剩余寿命预测方法中的典型代表为神经网络、支持向量机等, 具体发展动态分述如下.
- 神经网络
神经网络是一种模拟人类中枢神经系统组织结构与信息处理机制的学习网络, 主要由输入层、隐层和输出层组成[40]. 神经网络具有自学习、自组织、自适应以及强非线性映射拟合能力等优点[41-42], 因而在设备剩余寿命预测领域受到了学者们的广泛关注[43-45]. 早在2004年, Gebraeel等[46]就将单隐层前馈神经网络用于机械设备振动信号建模, 通过外推至失效阈值实现剩余寿命预测. Mahamad等[47]通过改进前馈神经网络训练算法, 将改进后的网络用于旋转机械的寿命预测. Lim等[48]采用特征时序直方图法从多源监测数据中提取了具有局部趋势性的退化指标, 然后将这些退化指标输入到多层感知机中去预测航空发动机的剩余寿命. Drouillet等[49]将单隐层前馈神经网络用于高速铣刀剩余寿命预测. Ahmadzadeh[50]等使用多层感知机去预测研磨机剩余寿命. Zhang等[51] 基于小波包分解、快速傅里叶变换和反向传播神经网络构建了鼓风机剩余寿命预测模型. 徐东辉[52]提出了多类神经网络组合预测的方法, 利用改进的Elman神经网络和非线性自回归神经网络两个单项预测模型进行预测, 并且借助于径向基函数神经网络对两个单项模型的预测值进行非线性组合, 实现了剩余寿命预测. 杨洋[53]研究了一种基于自回归移动平均和后向传播神经网络组合模型的锂电池寿命预测方法, 有效结合了两者在短期预测方面与非线性拟合方面的优势. 在最新的研究中, Bektas等[54]通过引入传感器选择、数据归一化、特征提取等数据预处理技术, 将预处理后的数据用于训练神经网络, 提出了一种基于神经网络和相似性的剩余寿命预测方法. Li等[55]利用监测数据训练了多个神经网络, 基于加权平均思想提出了一种基于集成网络的剩余寿命预测方法.
2)支持向量机
支持向量机是由Cortes[56]和Vapnik[57]于1995年首次提出的, 在小样本和高维数据机器学习领域受到广泛关注, 主要原理是首先通过非线性变换将多维输入向量映射到高维特征空间, 然后在高维特征空间中构造最优超平面来实现样本分类或回归. 由于支持向量机能够有效避免“维数灾难”问题, 且具有较好的泛化能力, 因而广泛应用于设备的剩余寿命预测中[58-61]. 例如, Soualhi等[62]利用Hilbert-Huang变换构建了滚动轴承的敏感退化指标, 然后将这些退化指标输入到支持向量机中实现了旋转轴承的剩余寿命预测; Sun等[63]构建了贝叶斯最小二乘法支持向量机预测模型, 并将其用于微波器件的剩余寿命预测; Nieto等[64]将支持向量机应用到了航空发动机的剩余寿命预测中; Khelif等[65]研究提出了一种不需要建立健康指标、故障状态等直接基于支持向量回归模型建立监测数据与设备寿命的拟合关系, 进而实现了剩余寿命预测. Huang等[66]对基于支持向量机的剩余寿命预测方法研究现状、应用领域及发展趋势进行了系统地梳理和分析.
3)其他浅层模型
除了以上几种常用的浅层模型外, 一些其他机器学习模型也被应用到装备的剩余寿命预测中, 如极限学习机[67]、贝叶斯网络[68]、随机森林[69]、梯度提升决策树[70]、基于案例的学习方法[71]、基于案例的推理方法[72]等. 文献[38]对基于浅层机器学习的剩余寿命预测方法进行了详细综述, 本文不再赘述.
通过文献总结分析可以发现, 虽然浅层神经网络训练相对比较容易, 基于浅层机器学习方法实现设备剩余寿命预测的研究具有较长的历史, 但这类方法中采用的网络结构简单、预测性能较多地依赖于专家先验知识与信号处理技术, 且难于量化剩余寿命预测结果的不确定性. 此外, 这类研究中较多的方法需借助人工经验与知识预先提取监测数据中的关键信息并构建退化指标, 因此退化指标的好坏将很大程度上决定浅层神经网络的预测性能. 在大数据时代, 设备退化特征愈发表现出耦合性、不确定性、非完整性等特点, 浅层机器学习算法自学习能力较弱, 难以自动处理和分析海量监测数据. 因此, 大数据下剩余寿命预测的智能学习模型由“浅”入“深”、势在必行.
3.2
基于深度学习的剩余寿命预测
深度学习作为一种大数据处理工具, 旨在模拟大脑学习过程, 构建深度模型, 通过海量数据学习特征, 刻画数据丰富的内在信息, 最终提升建模精度. 深度学习自从2006年在Science上首次提出便掀起了学术界和工业界的研究浪潮, 如雨后春笋, 以其强大的海量数据处理能力在诸多领域的大数据分析中方兴未艾. 经过了十余年的探索, 深度学习当前已成功应用于许多工程领域, 如图像识别[73]、自然语言处理[74]、语音识别[75]、故障诊断[76]等, 同时在剩余寿命预测领域也崭露头角. 如图1所示, 根据网络结构的不同, 这类方法主要包括: 基于深度自编码器的方法、基于深度置信网络的方法、基于卷积神经网络的方法、基于循环神经网络的方法以及多种网络组合而成的混合网络方法. 无论基于哪种深度网络结构形式, 其基本思想都是采用现有深度学习模型建立性能测试数据与剩余寿命标签或退化标签之间的潜在关系. 下面针对几种典型的深度学习网络, 介绍其应用于剩余寿命预测时的研究动态并分析当前研究存在的问题.
1)深度自编码网络
深度自编码网络是由多个自编码器或降噪自编码器堆叠组成的深度神经网络. 基于深度自编码网络的剩余寿命预测通过提取出原始数据的深层次特征, 然后通过逻辑回归层或全连接层实现机械装备的剩余寿命预测[77-80]. 由于自编码器是以重构原始输入为学习目标, 因而其学习到的特征对数据有更本质的刻画, 有利于提高预测精度, 且深度自编码网络能够以无监督学习方式逐层对网络参数进行预训练, 将训练结果作为反向微调的初始值, 确保了网络参数的在线更新, 在剩余寿命预测领域得到了广泛的应用[81-85]. 例如, Xia等[79]提出了一种基于深度自编码网络的两阶段剩余寿命预测方法, 首先运用深度降噪自编码器网络对监测大数据进行阶段划分, 然后训练深度自编码网络得到每个阶段的退化特征, 最后通过回归方法分析各阶段特征实现剩余寿命预测. 然而, 深度自编码网络在处理力信号、振动信号、声发射信号、光信号等高维原始监测数据时, 其仍需要借助各类信号处理技术来提取设备的退化指标.
2)深度置信网络
深度置信网络主要是由多个受限波尔兹曼机堆叠与一个分类层或回归层组合形成的深度网络, 通过逐层预训练和反向精调策略解决深度模型普遍存在的训练困难问题, 不仅能实现数据从浅层到深层的特征表示与提取, 而且能发现输入数据的分布式特征, 在深层特征提取方面获得了广泛的应用. 例如, Jiao等[86]提出了一种基于深度置信网络的健康指标构建方法用于装备的剩余寿命预测, 该方法采用无监督学习的策略融合多个传感器监测数据对装备健康状态进行评估, 得到描述其退化程度的健康指标用于剩余寿命预测. 需要注意的是, 深度置信网络在实际中的应用主要集中在深层次特征提取方面, 单纯利用深度置信网络实现剩余寿命预测的研究还相当有限, 需要与其他网络混合进行才能进行剩余寿命预测.
3)卷积神经网络
卷积神经网络作为一类经典的前馈神经网络, 是由LeCun等[87]首次提出并用于解决图像处理问题的, 主要由若干卷积层和池化层组成, 既能输入序列数据, 也能处理网格化数据, 在计算机视觉、语音识别等领域应用十分广泛. 针对设备性能监测大数据的特点, 先后发展出了多种用于剩余寿命预测的卷积神经网络, 主要包括深度卷积神经网络[88]、多层可分离卷积神经网络[89]、多尺度卷积神经网络[90]、联合损失卷积神经网络[91]等. Babu等[92]首次将深度卷积神经网络应用于剩余寿命预测领域, 采用两个卷积层和两个池化层提取原始信号特征, 同时结合多层感知器实现剩余寿命的预测. 最近, Yang等[93]提出了一种基于两个卷积神经网络的剩余寿命预测方法, 其中一个是分类网络用于监测性能退化的初始时刻, 另一个是回归网络用于预测剩余寿命. 相比于其他深度学习网络, 卷积神经网络能够更有效地处理力信号、振动信号、声发射信号、光信号等高维原始数据, 可实现从监测数据中自动提取退化特征信息, 适合处理监测大数据且具有降噪的功能, 同时其网络参数量相对较少, 训练更加方便高效, 因此易于构建更深的网络结构. 然而, 随机退化设备的监测数据蕴含的健康特征往往是时序相关的, 而卷积神经网络在应对大数据下时序特征提取能力不足, 容易造成重要时序特征的丢失, 这对于剩余寿命预测是不利的, 因此卷积神经网络在应用于剩余寿命预测时经常与其他深度网络组合使用.
4)循环神经网络
循环神经网络作为一类包含前馈连接与内部反馈连接的前馈神经网络, 主要用于处理具有相互依赖特性的监测向量序列, 由于其特殊的网络结构, 能够保留隐含层上一时刻的状态信息, 目前已经在剩余寿命预测领域得到广泛的关注, 被应用于锂电池系统[94]、风力发电设备[95]、航空发动机[96]等. 为解决循环神经网络通常存在“记忆衰退”进而导致预测偏差较大这一问题, 学者们对循环神经网络模型进行了改进, 提出了一种长短期记忆(Long short term memory, LSTM)模型, 门结构作为LSTM的独特结构, 能够在最优条件下确定出所通过信息特征, 在剩余寿命预测领域获得了广泛的应用[97-98]. 例如: 为解决运行和环境扰动引起的不确定性问题, Elsheikh等[99]对LSTM的结构分别进行了改进, 提出了基于双向LSTM的剩余寿命预测方法. 虽然循环神经网络在随机退化设备退化过程建模方面具有先天优势, 但当处理长期依赖型退化数据时, 循环神经网络在训练过程中也经常面临梯度消失或爆炸问题. 同时, 以上基于循环神经网络的剩余寿命预测研究中都未考虑预测结果不确定性的量化问题, 只能输出一个剩余寿命的点估计, 难以评估预测结果的置信度.
最近, 针对剩余寿命预测不确定性量化问题, Zhang等[100]在假定退化数据服从正态分布的前提下利用Monte Carlo方法从退化数据中随机采样, 通过改变LSTM网络输入, 在不同网络输入下得到不同的剩余寿命预测值, 由此构造剩余寿命的数值分布, 试图量化预测不确定性. Huang等[101]利用双向LSTM网络预测剩余寿命输出的均方根误差构建剩余寿命预测的误差带, 以区间的形式表示预测不确定性. Yu等[102]对退化监测数据进行划分、以退化量为标签, 建立了多个基于LSTM网络的退化量预测模型, 然后通过滚动预测的思想将预测值作为模型输入迭代预测至退化量超过失效预测的时刻, 由此确定设备的剩余寿命预测值. 进一步, 为综合多个LSTM网络预测值, 引入Bayesian模型平均方法, 估计各个模型的后验概率, 由此可以确定最终的剩余寿命预测值和预测置信区间, 有效提高了剩余寿命预测精度的同时以置信区间的形式表示了预测不确定性. 以上思路在基于机器学习方法的剩余寿命预测不确定性量化方面做出了有益的尝试, 然而无论是改变输入条件构建数值分布、基于均方根误差构建误差带, 还是构建多个预测模型通过Bayesian模型平均构建置信区间, 都更多地反映了网络训练的效果而不能全面反映设备性能退化固有的时变随机性和动态特性.
5)混合深度网络
基于混合深度网络的方法可看作多个深度学习网络以一定方式组合连接(如串联、并联等)用于弥补现有单一深度学习网络的不足, 目前主要的混合形式包括深度置信网络 + 前馈神经网络[103]、受限玻尔兹曼机 + LSTM网络[104]、LSTM网络 + 卷积神经网络[105]、LSTM网络 + 编码−解码模型[106]、循环神经网络 + 自编码器[107]、多损失编码器 + 两阶段卷积神经网络[108]等. 这类方法主要通过继承不同深度学习模型的优势, 进而期望实现取长补短、改善剩余寿命预测的效果. 例如: Ren等[109]提出了一种堆栈自编码器与前馈神经网络组合的轴承剩寿命预测方法, 该方法能够有效利用堆栈自编码器在特征表示方面的优势, 同时将其引入至前馈神经网络可有效避免训练过程中的局部最优问题; Deutsch等[104]提出了一种融合深度置信网络与前馈神经网络的旋转设备剩余寿命预测方法, 这是基于深度置信网络方法的改进和拓展, 能够有效结合深度置信网络特征提取能力与前馈神经网络的预测性能. 虽然通过混合深度网络进行剩余寿命预测有助于产生互补效应, 但混合多种深度网络将不可避免地导致剩余寿命预测模型的训练复杂化, 而且混合方式的选择基本上是启发式的, 缺乏公认统一的形式. 因此, 发展剩余寿命预测相关性能要求牵引下的混合深度网络构建方式以提高混合方式的可解释性仍有待深入研究.
需要说明的是, 基于深度学习的剩余寿命预测研究正在蓬勃发展, 以上介绍到的文献仅是冰山一角. 通过对当前相关研究发展动态的分析不难发现, 无论是传统的基于浅层机器学习还是正在蓬勃发展的基于深度学习的剩余寿命预测研究, 基本上都可以归结到两种思路, 即基于退化量滚动预测和基于学习网络建立监测数据与失效时间端到端的映射. 虽然在以上两种思路下的剩余寿命预测方法研究快速发展, 且都属于数据驱动的方法, 但当前研究面对剩余寿命预测现实需求时主要存在以下有待解决的问题:
1)目前这些基于机器学习的剩余寿命预测研究, 基本上都是将其他领域应用需求驱动下提出并发展起来的各种深度网络直接应用, 其网络结构和参数均是确定性的, 一般只能得到确定性的剩余寿命预测值, 很难得到能够量化剩余寿命预测不确定性的概率分布. 正如第1节所讨论的, 剩余寿命预测针对的是设备将来的失效事件, 而设备性能退化在预测区间内受到环境、负载等多重随机因素影响, 导致剩余寿命预测结果不可避免地具有不确定性, 因此剩余寿命预测不确定性的量化表征是该领域的一个核心问题. 然而, 目前基于机器学习的方法对这方面重视不够, 在预测不确定性量化能力上存在不足. 无法量化预测不确定性也意味着无法量化预测结果带来的风险, 由此导致难以满足以最小化运行风险或最小化费用为目标的健康管理相关决策(如维护决策、备件订购等)对运行风险定量评估的应用需求[39]. 造成以上问题的根本原因在于所采用的学习网络并不是针对剩余寿命预测的核心需求设计的, 更多的是直接采用或借鉴其他任务需求下发展起来的学习网络. 因此, 如何设计并发展面向剩余寿命预测及其不确定性量化需求的专用学习网络, 使得其能够从监测数据中学习到反映预测不确定性的剩余寿命概率分布相关的信息, 是克服现有研究发展瓶颈的根本途径和有重要价值的研究方向.
2)现有研究中通过学习网络建立监测数据与失效时间端到端映射以预测剩余寿命的思路, 其成功实现的前提是能够获取充分的同类设备失效时间数据以制作训练标签. 然而, 在工程实际中, 由于受到安全性与经济性等因素的限制, 设备运行至失效状态是极其危险的, 一般在失效前对设备进行替换. 在该情况下, 所能获取的更多的是设备在服役过程中积累的大量状态监测数据, 关于设备失效时间的数据几乎没有, 因而这类状态监测大数据大多属于非全寿命周期类型. 尽管大数据背景下非全寿命周期数据包含了丰富的设备退化机制与寿命信息, 但由于失效数据匮乏将导致现有基于机器学习的剩余寿命预测方法中所需的寿命标签难以制作(即零寿命标签问题), 由此为构建监测数据与剩余寿命之间端到端的映射关系带来了极大的挑战. 与此同时, 基于退化量滚动预测的思路以退化量为标签构建预测模型, 能够减少对寿命标签数据的依赖, 但在实现过程中将本身存在误差的退化量预测值作为预测模型输入进行滚动预测, 容易造成预测误差的累积, 进而影响剩余寿命预测的准确性. 此外, 目前基于以上思路的剩余寿命预测研究主要针对完整监测数据, 而对于图2所示的“碎片化、分段的、稀疏的”非完整监测大数据与剩余寿命之间的映射关系鲜有研究. 因此, 零寿命标签情形下如何通过非完整监测大数据构建随机退化设备剩余寿命预测模型, 发展剩余寿命预测研究的新范式仍有待解决.
3)如前所述, 剩余寿命预测是衔接设备健康状态感知与基于状态感知信息实现设备的个性化精准健康管理的桥梁, 因此剩余寿命预测方法的可解释性对于将预测结果用于设备的健康管理(如预测维护、备件订购等)至关重要. 然而, 现有基于机器学习的剩余寿命预测方法通过学习网络建立监测数据与剩余寿命之间的映射关系, 监测数据与剩余寿命之间的关系难以显式表示, 呈现“黑箱” 特点, 难以解释设备退化失效机理. 此外, 当前的研究较多地关注了剩余寿命预测的准确性, 但机器学习模型中超参数的选择对预测结果的准确性和鲁棒性具有重要影响, 预测的效果对调参技巧和经验有较大的依赖, 而如何合理有效地选择机器学习模型的超参数在机器学习领域本身就是一个极具挑战性的问题. 综合以上两个方面可见, 发展具有可解释性的基于机器学习的剩余寿命预测方法, 将有助于打通当前这类方法从理论研究到推广应用于设备健康管理的最后一公里. 提高基于机器学习的剩余寿命预测方法的可解释性的研究方向包括在学习网络设计中考虑设备退化失效的机理知识、基于学习网络从监测数据中提取退化特征时将特征的趋势性或单调性作为约束条件考虑、将超参数的选择问题转化为提升预测效果的优化问题纳入模型训练过程等.