预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

过程回归建模综述摘要:工业生产中常常需要对某些难以直接测得或者测量成本很高的变量进行软测量建模。目前已经有许多软测量建模方法,包括机理,数据驱动以及这两者的结合。本文则从其中一种软测量建模方法——回归建模出发,介绍了几种常见的回归建模方法,简单分析其原理并简要简绍它们的一些应用。关键字:软测量,建模,回归引言在过程控制中,若要使生产装置处于最佳运行工况、实现卡边控制、多产高价值产品,从而提高装置的经济效益,就必须要对产品质量或与产品质量密切相关的重要过程变量进行严格控制[1]。由于工业生产中装置是不断运行的,生产产品的浓度、质量等指标是动态变化的,利用一些在线传感器,不仅成本较高,并且由于一定的滞后性,导致最后不能精确监测生产过程中的一些指标,难以满足生产需求。除此之外,许多复杂的化工过程中往往不能使用传感器来对某一变量进行直接测量。例如化工生产过程中,精馏塔产品组成成分,塔板效率,干点、闪点等;一些反应器中不断变化的产品浓度,转化率以及催化剂活性等等[1]。这就使得软测量技术被提出并不断发展起来。回归分析是建模的一种基本方法,在软测量建模中应用相当广泛[2-9]。常用的方法有部分最小二乘回归法(PLSR)、多元线性回归(MLR)、多元逐步回归法(MSR)、主元回归法(PCR)等。本文将简略介绍以上几种回归建模的方法以及它们的应用,并进行各自方法的特点、优势进行简单分析。1软测量和回归分析的关系所谓软测量技术,就是将不可测变量(称为主导变量)进行间接测量,通过建立与之相关系的其他变量(辅助变量)之间的数学关系模型,进行在线的估计。这类方法响应迅速,实时性好,可靠性高。它可以很好的解决变量不可测量的问题,也为对生产过程的监测控制节省了大量成本。软测量的应用范围很广,它最原始和最主要的应用都是有关对过程变量的预测,而这些变量可以通过低频率采样或者离线分析确定。同时,这些变量经常涉及到过程输出的品质,对于过程的分析和控制显得尤为重要。由于这些原因,如何在高采样频率或者低成本的情况下利用适当的软测量建模方法来获得过程变量的信息是非常重要的。目前软测量建模也发展出多种方法[10],各自都有其优缺点,选择适当的软测量建模方法,对工业生产具有很大意义。回归分析是统计数学的一个重要分支,在实验数据处理中又称为“曲线拟和”。回归分析有多种形式,按因变量和自变量是否存在线性关系可分为线性回归(LinearRegression)和非线性回归(NonlinearRegression);按自变量的个数又可分为一元回归(SingleRegression)和多元回归(MultipleRegression)。同时,回归分析也是一种建模方法,是数据驱动类软测量的一种。2多元回归分析2.1基本原理MLR(MultipleLinearRegression)多元线性回归问题能够阐述为m个变量与一个变量之间的线性关系。它的数学表示为:(2-1)(2-2)(2-3)上式中,为自变量,为自变量。和分别为回归系数和残差数。以上式子只描述了存在一个样本的情况,如果有n个样本,那么可以写成一个列向量,b不变,向量能写成矩阵的形式(2-4)当自变量的个数大于样本的个数,式中的b有无穷多个解。当变量的个数等于样本的个数,这种情况在现实中很少见。尽管如此,在X满秩的前提下,b有唯一解。此时,可以把公式写成:,其中e称为残差向量,此时它为零向量。当变量的个数小于样本的个数,此时,得不到b的准确解。最常用的方法是采用最小二乘法,获得的解为:,但有可能会遇到逆不存在的情况。2.2MLR的应用用MLR建立的线性回归模型物理意义明确,计算简单。因此它广泛应用于处理多因变量或多指标的回归分析、方差分析等统计分析问题。文献[11]采用MLR的方法建模,对蒸馏装置常压塔的分子筛料干点的软测量进行了仿真试验。文献[12]则利用多元线性回归获得系统的预估马尔科夫参数,用来进行状态空间辨识,提出一种辨识算法SSARX-MLR。MLR的缺点是仅限于解决操作点变化范围较小的线性问题或非线性不太严重的问题。3多元逐步回归3.1基本原理当应用回归分析去处理实际问题时,一个重要问题就是选择回归自变量。一般说来,根据问题本身的专业理论及有关经验,研究人员往往尽可能多地罗列出可能与因变量有关的自变量,避免遗漏重要变量。其中有一些变量对因变量实质上根本没有影响或影响很小。如果回归模型把这样一些变量都包含进来,不但计算量大,而且估计和预测的精度也会下降。在有些情况,获得某些自变量的观测数据所花的代价较大,如果这些自变量本身与因变量的关系很小或根本就没有关系,但错误地选进模型,会使模型应用的费用不必要地升高。正是由于这些原因,在应用回归分析时,有必要对进入模型的自变量作一定的筛选。筛选自变量的方法有很多,其中多元逐步回归(M