GB/T 22394.2-2021 机器状态监测与诊断 数据判读与诊断技术 第2部分:数据驱动的应用.pdf
- 文档部分内容预览:
数据驱动监测常用方法有自相关核回归法(AAKR)、聚类和偏最小二乘法(PLS (SVM)和马氏田口法(MT)
4.2资产关键故障和过程参数选择
实施数据驱动监测的过程在ISO17359中有精确的描述。包括两个重要的审核
设备审核:识别设备及其功能; 可靠性和关键性审核:绘制可靠性框图电力弱电技术、方案,建立设备关键性并完成失效模式、影响及危害度分析。 一且完成初步研究和识别出关键故障清单,就有必要列出历史数据中或者特定监测系统中的可用 过程数据。振动监测系统就是这样的例子。 如果监测关键故障的范围没有完全覆盖,就有可能需要考虑增加传感器或者考虑调整现有传感器 的位置
4.3数据清洗和重采样
为了构建一个稳健性强的模型,应首先收集信号验证所需要的、涵盖所有系统工况的数据,这些数 据是已收集并储存的历史数据。事实上,由于一些诸如插值误差、随机数据误差、缺失数据、重要数据丢 失、数据卡顿及其他等异常情况的发生,这些数据可能并不总是表示真实的设备状态。宜一直进行数据 检查和纠正数据, 注意:删除数据前应慎重
使用历史数据训练模型时,通常遇到的第一 个问题是可用的、处理过的数据与实际数据并不一致, 但可以用数据归档程序中压缩的数据代替。通常,历史数据记录软件创建的数据库文件是时间序列数 据库文件。然而,并非所有时刻采集的数据都存储。只有数据值的变化超过规定的量时才存储其数据 并加上一个时间截。这种方法只需要很少的存储空间,但却损失了数据的保真。当从历史数据中提取 数据时,记录数据之间的数据值或者通过简单的线性插值计算,或者通过第二个数据点的步长计算。数 据结果显得是锯齿时间序列,可能严重改变传感器之间的相关性。
4.3.3数据品质问题
几个最常见的数据品质问题是: 数据缺失; 噪声或随机数据; 有缺陷的传感器导致的未更新或标定失效的数据: 不合理的数据(超出范围)。 大多数这样的数据问题可以直观地识别,或者通过数据清洗实用程序监测到。这些实用程序可剔 除坏的数据或者用某种算法得到最可能的数据替代坏数据。常见的是从训练数据集内删除所有的坏数 据。大多数软件系统都包括自动数据清洗工具。这些工具软件能很容易地识别极度偏离期望值的数 据,但是对期望运行域内的数据偏差通常不敏感。 。训练数据集内的坏数据点会使模型失效
数据一旦清洗,可能需要在更低的速率下重采样,该速率由运行模式决定。这样,建议保留所有 同戳以描述重要运行参数(如:机器停机)的瞬态特征。然而在稳态运行工况,每10min采集一个 详本(平均或不平均获得)可能就足够了
模型开发不是简单的。需要完成几个步骤,包括
4.4.3相关工况和数据的选择
模型应使用涵盖所有工况的数据进行训练。由于工况是由系统结构、传感器值和作业程序界定的, 所以不同设备的工况会有显著不同。 一个工况变化的例子是备用泵的定期使用,或者穴余泵的周期使用。为了模型能正确工作,对系统 的每个工况都应进行训练。但是对某些不常用工况的过分训练会降低最常用工况下模型的性能。因 比,某些设备的工况可能从不列人训练集合 工况还会由于设备的维修而改变。这种情况下,模型应进行重新训练以考虑新的工况 最后,工况也会由于一些周期性的现象而改变,如:季节变化。如果一个模型是用夏季收集的数据 川练的,在冬季时气温和冷却水温等有了显著的不同,模型可能表现不好。另外,外界环境的异常变化 也会影响模型的性能,例如:如果一个模型是用典型夏季数据训练出的,在异常热的夏天冷却水温更高, 模型可能不能正确工作。这种情况下,新工况的数据应加到训练数据中。 谨记一些特殊工况如下: 宜注意机器维修的时间,因为维修会显著改变机器的性能; 有必要考虑维修时间间隔很长的机器,那表明机器性能会显著劣化; 构建模型时要注意当前运行工况之前的瞬态影响(例如:之前的功率或速度变化)
4.4.4模型测试准备
在识别了所有的典型工况之后,下一步就是选择输人数据并将数据划分为训练数据、检验数据以 式数据。通常,用户没有优先的分类方法可选,因为其取决于监测工具。 训练和检验数据用于并发和测试生产设备的模型。使用带附加偏差的检验模型组成的测试集 古模型的监测性能
监测过程的下一步是选择和优化模型参数,这些参数对于不同的方法可能是不同的(例如:核函 度、最大簇直径、特征值的数量和隐层数量等)
利用训练数据对模型进行训练,利用检验数据进行评估。选取检验数据上性能最好的模型参数。 一旦最终的模型参数通过训练数据和检验数据选定后,就可以利用测试数据集评估模型的总体性能。 重要的是测试数据不用于调整模型参数,而只是对模型进行总体性能的偏差评估。另外,当传感器有漂 移时,模型的性能评估可通过依次给每一个传感器读数一个逐渐加大的偏差,并用模型的输出校正传感 器故障的方法来完成。然后,利用有缺陷输入数据的预测值来确定模型的稳健性和溢出效应。稳健性 可解释为当传感器由于某种故障导致数值不正确时,数据驱动模型做出正确的传感器预测的能力度量, 溢出效应是有缺陷的传感器输入对其他传感器输出的影响
在一个成功的监测应用中,设置监测模型的预警值和报警值是一项关键的任务。设置模型的预警 值是一项平衡模型漏报警和误报警的可能性和敏感度的行为。 设置预警值最常用的方法是选择一个从工程的角度看合理的数(阈值)。该设置值可基于单个参数 的残差或者实际样本与训练模型之间的整体差距进行调整,或者基于两者进行调整。 此外,建议对开发的数据驱动模型性能进行量化表示,并根据模型的估计精度对预警设置值进行 调整。 报警值定义的最常用方法是使用逻辑滤波规定在给定窗口内发生预警的数目。这类逻辑窗的应用 过滤掉了出现大残差值的虚假点,有效地减少了预警的数目。 设定预警值和报警值的决定性要素是选择用哪个监视器的信号给出报警。通常,没必要对模型中 所有的信号给出报警。总的来说,决策要基于工程判断,即给定信号对被监测设备健康状态的响应是如 何表示的。
5实施数据驱动诊断的过程
5.2自动模式分类方法
模式分类的目标是根据先验的知识 (模式中提取的统计信息对数据模式进行分类。被 成的模式通常是一些测量组,在适当多维空间中的定义点群
分类或描述方案通常基于一组已分类或描述模式的可用性,这组模式叫做训练集(见图2),产生的 学习方法特征是有监督的学习
清晰界定可以接受的区域边界,以避免错误诊断和允许自动诊断。残差数据的应用能使模型不受机器 的初始状态的影响,而仅考虑数据流特征因监测到的故障而发生的演变。 对于具有稳定状态特征的故障,模式分类可能容易地实现。对于具有随时间变化特征的故障(磨 损、摩擦、裂纹等)分类是可能的,但比较困难
5.3简化的自动特征分类方法
本附录给出一个数据驱动监测应用的示例
照明标准规范范本A.2联合循环汽轮机的振动特性
运行过程中,这台汽轮机的轴承绝对振动达到异常水平,产生运行报警。 本示例研究的目的,是利用经验模型识别振动变化趋势是由于运行参数的变化引起的,还是由于汽 轮机中间轴承的机械问题引起的。 本示例中考虑了几个输入量:有功功率、蒸汽输入流量和背压。输出参数是汽轮机两个中间轴承振 动的均方根值,单位:mm/s。 图A.1中用红色表示三个阶段(训练阶段、正常行为阶段和异常行为阶段)模型估计的振动值。 这里提出两个理由来解释这种振动特性的变化: a)在上次停机过程中,整体结构刚度出现漂移或者改变,或者两者兼而有之; b)以前从未达到过这么高的背压。 由图A.1的分析推断: 残差(红线和蓝线之间的差别)的微弱变化趋势,要经过数月的时间才能检测到; 变化趋势与运行参数的长期变化无关,
图A.1三种汽轮机状态的估计振动值
B.1使用模式识别技术监测感应电动机轴承故障
感应电动机是许多工业过程的关键部件,常集成到商业应用的设备中。安全性、可靠性、效率和性 能是感应电动机应用中最关心的一些问题。对于轴承故障,例如可利用FFT分析特征故障谐波幅值来 监测。通过人工神经网络(ANNs)的模式识别技术可用于滚动轴承的故障诊断(图B.1)
图B.1轴承部件和故障特征频率
多层神经元网络包括一个输入层、一个输出层和一个或多个隐层。 输入层连接谱线,输出层表示待诊断轴承的状态(健康,外圈故障/fo,内圈故障/fia,保持架故障电缆标准规范范本, 和滚动体故障/fba)。重要的是记住故障症状与轴转速频率,有关。 人工神经网络(ANNs)用已知机器状态的实验数据子集训练。 神经元网络一旦训练好,就可使用剩余的数据集来评估所推荐的这个方法的效率。 经过训练和评估后,人工神经网络(ANNs)模型就可以利用FFT的描述符(这里指频谱特征)进行 自动诊断。
....- 数据标准
- 相关专题: