预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113821982A(43)申请公布日2021.12.21(21)申请号202111176741.1(22)申请日2021.10.09(71)申请人上海交通大学地址200240上海市闵行区东川路800号(72)发明人孙衍宁秦威许鸿伟谭润芝王无印(74)专利代理机构上海交达专利事务所31201代理人王毓理王锡麟(51)Int.Cl.G06F30/27(2020.01)G06F111/08(2020.01)权利要求书2页说明书6页附图4页(54)发明名称工业软测量中考虑因果效应的辅助变量选择方法(57)摘要一种工业软测量中考虑因果效应的辅助变量选择方法,基于软测量建模对象的历史数据集,经过预处理得到离散化的候选变量集和主导变量数据样本;通过每一个候选变量与主导变量的互信息确定每一个候选变量与主导变量的因果效应;采用基于因果效应的变量筛选算法,保留所有因果效应不为零的候选变量作为辅助变量集。本发明通过考虑候选辅助变量与主导变量之间的因果效应,不依赖于任何模型,不需要设置停止阈值,自动地选择因果效应不为零的候选变量组合作为辅助变量集,为工业软测量建模提供有用参考。CN113821982ACN113821982A权利要求书1/2页1.一种工业软测量中考虑因果效应的辅助变量选择方法,其特征在于,基于软测量建模对象的历史数据集,经过预处理得到离散化的候选变量集和主导变量数据样本;通过每一个候选变量与主导变量的互信息确定每一个候选变量与主导变量的因果效应;采用基于因果效应的变量筛选算法,保留所有因果效应不为零的候选变量作为辅助变量集;所述的历史数据集是包含M个变量的N个等时间间隔的观测样本,其中前M‑1个变量是候选辅助变量,即F={X1,X2,...,XM‑1},第M个变量是主导变量。2.根据权利要求1所述的工业软测量中考虑因果效应的辅助变量选择方法,其特征是,所述的预处理是指:采用基于直方图的等长划分方法来离散化数据,有效考虑工业数据中1/3存在的离群点问题,最佳划分长度nh=max(R/(2·IQR/N),log2N+1),其中:R是样本的极差,IQR是样本的四分位数范围,N是样本的数目。3.根据权利要求1所述的工业软测量中考虑因果效应的辅助变量选择方法,其特征是,所述的每一个候选变量与主导变量的互信息是指:I(X;Y)=H(X)+H(Y)‑H(X,Y),其中:X和Y表示两个离散随机变量,H(X)和H(Y)分别表示X和Y的香农熵,表示随机变量所含的平均信息量或不确定性的大小;H(X,Y)表示X和Y的联合香农熵;香农熵H(X)=‑∑xP(x)logP(x),联合香农熵H(X,Y)=‑∑x,yP(x,y)logP(x,y),H(·)表示香农熵,P(·)表示概率质量函数。4.根据权利要求3所述的工业软测量中考虑因果效应的辅助变量选择方法,其特征是,所述的每一个候选变量与主导变量的互信息,为降序排列。5.根据权利要求1所述的工业软测量中考虑因果效应的辅助变量选择方法,其特征是,所述的每一个候选变量与主导变量的因果效应其中:联合条件互信息H(Y|X1,X2,...,Xk)表示给定一组候选变量{X1,X2,...,Xk}后Y的剩余不确定性,联合条件互信息H(Y|X1,X2,...,Xk,Xk+1)表示进一步给定候选变量Xk+1后Y的剩余不确定性,则表示Xk+1对Y的因果效应,k≤M‑1。6.根据权利要求3所述的工业软测量中考虑因果效应的辅助变量选择方法,其特征是,两个联合条件互信息进一步表示为联合香农熵的形式,具体为:H(Y|X1,X2,...,Xk)=H(X1,X2,...,Xk,Y)‑H(X1,X2,...,Xk),H(Y|X1,X2,...,Xk,Xk+1)=H(X1,X2,...,Xk,Xk+1,Y)‑H(X1,X2,...,Xk,Xk+1)。7.根据权利要求1所述的工业软测量中考虑因果效应的辅助变量选择方法,其特征是,所述的基于因果效应的变量筛选算法是指:根据包含M‑1个候选辅助变量的集合F={X1,X2,...,XM‑1}及其主导变量Y,从F中选择因果效应不为零的一个特征加入到辅助变量集S中,具体为:8.一种实现权利要求1~7中任一所述方法的工业软测量中考虑因果效应的辅助变量选择系统,其特征在于,包括:数据采集和预处理模块、辅助变量选择模块、软测量模型构建模块以及模型维护模块,其中:数据采集和预处理模块直接采集工业现场仪表得到的历史数据,并进行数据去噪、空值和异常值检测处理,得到辅助变量选择及软测量建模所需历史数据集;辅助变量选择模块根据历史数据信息,选择与主导变量关系密切的辅助变量集合,从而剔除冗余信息、降低软测量建模难度和模型复杂度;软测量模型构建模块综合考