软测量的产生

​ 在现代工业过程中,为了实现节能降耗、提高企业效益等,需要对过程性能进行及时监测和控制。及时检测工业过程中的关键质量变量,对于监控工艺状态、实现对工艺过程的有效控制有着重要意义。

​ 然而,在实际工业过程中,仅使用硬件检测装置,难以对一些关键质量变量实现及时获取。例如,在一些高温高压、强酸强碱等极度恶劣的工业现场环境下,传感器受限于自身的材料性能等,无法正常工作;在石油化工等工业环境中使用的成分分析仪器如气相色谱仪等,对待测样本的检测需要较长时间,无法及时反馈质量变量。除了上述限制外,硬件检测装置还会遇到元件老化、精度下降等问题,需要定期校准维护,存在诸多不便。

​ 为了解决这些测量相关的问题,软测量技术应运而生。不同于传统的硬件装置测量方法,是一种间接测量方法。软测量通过采集与关键质量变量联系紧密的易测辅助变量,构建某种数学模型,实现对关键质量变量的预测估计。相较于硬件装置测量方法,软测量由于其间接测量的特点,具备了许多优点,例如快速响应、成本低廉、便于维护、操作安全、方法灵活多样等。基于上述优点,软测量技术大量应用于化工、冶金、制药等工业领域。

软测量的研究内容

​ 软测量通过采集辅助变量,构建某种数学模型,实现对关键质量变量的预测估计。软测量的基本步骤(如图 1.2所示)主要包括四个环节:

(1)辅助变量选择
选择方便测量且与关键质量变量关联性较强的辅助变量。辅助变量若选取恰当,可以在较少的过程变量子集中尽可能多地包含关键质量变量相关的信息,进而便于建立从辅助变量到关键质量变量的模型。辅助变量的选取方法有机理分析法、数学分析法等,前者使用过程工艺或过程物化反应等过程机理知识来筛选辅助变量,后者则运用数学与统计学知识来选取合适的辅助变量集。
(2)数据采集与预处理
采集并选取合适的历史数据,并进行数据预处理。合适的历史数据应能够覆盖过程的典型工况状态,且应满足采样的均匀性、精简性等。对选取的历史数据进行预处理,可以使实际模型能够更有效地处理数据,基本步骤有数据的归一化、对缺失数据的处理、检测并替换异常值、对漂移数据的处理以及检测相关变量之间的延迟等。
(3)软测量模型建立
建立辅助变量到关键质量变量的预测模型。这一步骤是整个软测量过程的关键,对软测量的性能有着直接影响。软测量模型的选择取决于过程对象的特性,并且依赖于先验知识。常用的模型有机理模型和数据模型两种。
(4)模型维护与校正
在模型完成部署并投入使用后,需要定期对其进行维护和校正。在实际工业过程中,由于现场设施退化、催化剂活性降低、环境改变等原因,过程特性随时间推移发生缓慢变化,先前构建的软测量模型预测性能恶化,无法适应当前工况。为了适应工业过程的时变特性,维持模型的预测性能,需要定期对模型进行维护与校正,常用的方法有增量学习、即时学习等。

常用的深度学习方法

常用的深度学习方法主要有以下四种:
(1)受限玻尔兹曼机(RBM)
RBM是一种具有一个可见层和一个隐藏层的无向概率图模型。同一层的神经元之间没有联系,这就是受限的含义。RBM的目标是使可见层的输出尽可能接近原始输入,从而将隐藏层视为可见层的不同表示。RBM是一种基于能量的概率图模型,可用极大似然随机梯度下降法训练,通常使用蒙特卡罗马尔可夫链来获得模型样本。
RBM有多种扩展,其中深度信念网络(DBN)是多层的无向图模型,用于学习输入的深层表示。而深度玻尔兹曼机(DBM)是一种混合了有向和无向连接的模型,除最上面两层为无向(纯RBM)外,其他所有层的连接都是有向的(贝叶斯网络)。DBN具有多个隐藏层,并将相邻层中的隐层单元连接起来。DBN采用贪婪算法分层预训练,然后采用Wake-Sleep算法对其进行微调。一般来说,DBM比DBN具有更强的鲁棒性,但由于DBM需要联合训练,其计算复杂度较高。
RBM作为一种无监督非线性特征提取器,其提取的特征可以利用回归器如SVR和多层感知机(MLP)等进行回归预测,被广泛应用于工业过程建模中。例如,Fan等[30]针对燃煤锅炉过程中多变量之间非线性程度高、相关性强的问题,提出了一种基于连续RBM和SVR算法的深度模型。Lian等利用DBN和SVR结合改进的粒子群优化算法来完成转子热变形预测任务。Liu等提出了一种基于DBN的软测量模型,用于预测纯化对苯二甲酸(PTA)工业生产过程4-羧基甲糖宁的浓度。Liu等提出了一种集成的深度核学习模型,预测工业聚合过程中的熔体指数,该模型采用DBN进行无监督特征提取器,以解决聚合物工业中数据丰富但信息贫乏的问题。

(2)卷积神经网络(CNN)
CNN是一种特殊的神经网络,由多个卷积层和池化层堆叠组成,卷积层进行特征提取,池化层进行特征选择,其最后一层可通过全连接层后输出,用于特定建模任务。CNN常用于处理具有网状结构的数据,如时间序列数据(以固定时间间隔采样堆叠的数据)和图像数据(多维的像素数据)。CNN具有局部感受野、权值共享与下采样的特性,具有极强的局部特征学习能力。
近年来,CNN也被广泛应用于工业过程软测量中。例如,Horn等在铂的泡沫浮选中使用CNN提取图片特征,相较于传统纹理特征提取方法具有更好的特征提取速度和预测性能。Yuan等提出了一种多通道CNN,将不同的变量特征的排列作为通道数,构成3维向量,借此加强对局部感受野内不同变量间关系的提取,并用于脱丁烷塔和加氢裂化过程的软测量。此外,Wang等将过去多个时刻的采样拼接在一起构成输入,使卷积核仅沿时间方向移动,以提取一定时间内的动态特征。Jie等在网络的最底层利用卷积层和最大池化层对磨机轴承的振动频谱特征进行特征提取,用于球磨机内部高度复杂环境下的料位测量。
(3)循环神经网络(RNN)
RNN用于处理序列输入的数据,每个时刻都有一个输入、一个隐藏单元和一个输出,隐藏单元之间存在循环联系。因此,RNN的每个神经元除了可以接收当前时刻的信息外,还可以接收其之前时刻的信息。RNN的训练采用时间的反向传播算法,由于时间上的关联性,当输入序列较长时,传播的梯度容易产生消失或爆炸现象,称为长期依赖问题。而采用门控机制的方法,如长短时记忆网络(LSTM)和门控循环单元(GRU)等,则可以利用多个门控单元来对历史信息进行选择性记忆。
RNN由于其强大的时间信息提取能力,在具有强动态属性的流程工业中得到了广泛的研究与应用。例如,Pisa等利用LSTM网络预测污水处理厂氮源成分的含量。Yuan等提出了一种监督LSTM网络,将质量变量也作为LSTM的输入,同时利用辅助变量和质量变量学习动态隐层特征,并在青霉素发酵和脱丁烷塔过程上验证了其性能。Feng等基于LSTM,提出了一种双向注意力机制的编码解码网络,考虑了多个输出量在工序上的先后序列关系,应用于多工序的实际卷烟生产过程。Raghava等提出了一种时间延迟神经网络(TDNN)的RNN用于对理想反应精馏塔的状态估计。Yin等提出了一种将SAE与双向LSTM相结合的集成半监督模型,不仅可以提取和利用有标记和无标记数据中的特征,而且考虑了质量变量自身隐含的动态特征,用以预测煤质指标。Zhang等提出了一种基于GRU的鲁棒动态特征深度提取方法,并在脱丁烷塔蒸馏过程中取得了良好的性能。
(4)自编码器(AE)
自编码器包含一个编码器和一个解码器,是一种无监督的神经网络,其目的是让解码器的输出尽可能与编码器的输入相等,编码解码的过程称为重构。通常情况下,自编码器的隐层维数小于输入维数,可以提取输入数据中相对重要的特征。AE也可以通过堆叠来构建更深层的网络,即堆叠自编码器(SAE),可以提取更抽象的特征表示。SAE的学习策略是无监督的分层训练过程。
由于具有良好的可拓展性,AE得到了广泛的研究,许多学者提出了基于AE的拓展模型,如降噪自编码器(DAE),稀疏自编码器(Sparse AE),收缩自编码器(CAE)等。
自编码器及其变体广泛应用于处理半监督学习和处理工业过程中缺失数据的软测量建模中。将AE与传统的机器学习算法相结合,可以获得优异的性能。由于AE是一种无监督学习模型,为了完成预测任务,其经常被修改成半监督或有监督的形式。例如,Sun等利用门控单元来度量不同隐含层中特征的贡献度,从而更好地控制隐含层与输出层之间的信息流。Wang等基于VAE和Wasserstein GAN提出了一种生成模型,其可以从工业过程中生成相同分布的真实数据,这是传统回归模型难以实现的。Guo等提出一种即时学习建模方法,采用加权最小二乘方法提取各特征变量的分布,并通过一个数值算例和一个工业过程验证了该方法的有效性。Moreira等提出了一种基于堆叠自动编码器、互信息(MI)和LSTM的深度代表性学习,以处理工业过程数据的非线性、动态性和数据缺失。