预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106897821A(43)申请公布日2017.06.27(21)申请号201710059643.7(51)Int.Cl.(22)申请日2017.01.24G06Q10/06(2012.01)G06Q50/06(2012.01)(71)申请人中国电力科学研究院地址100192北京市海淀区清河小营东路15号申请人国家电网公司国网宁夏电力公司电力科学研究院国网宁夏电力公司(72)发明人张春张军于之虹杨超平鲁广明张爽戴红阳高峰田蓓田芳马军李岩松马天东苏明昕(74)专利代理机构北京安博达知识产权代理有限公司11271代理人徐国文权利要求书3页说明书11页附图3页(54)发明名称一种暂态评估特征选择方法及装置(57)摘要本发明提供了一种暂态评估特征选择方法及装置,该法包括:构建加权随机森林模型;从计算的特征重要性中删除重要性最低的特征;对删除后保留的技术特征进行最终特征排序;根据袋外数据OOB错误率曲线变化情况,保留排名靠前的特征。本发明提供的技术方案的加权随机森林通过引入少数失稳样本数据权重因子即可有效减少不平衡数据对特征选择的影响,能选择出比普通随机森林算法性能更优的特征子集;无需人工设定阀值大小,确保了选取特征子集的合理性。CN106897821ACN106897821A权利要求书1/3页1.一种暂态评估特征选择方法,其特征在于,所述方法包括:I、构建加权随机森林模型,得到特征重要性和袋外数据OOB错误率;II、从计算的特征重要性中删除重要性最低的特征;III、对删除后保留的特征进行最终特征排序;IV、根据袋外数据OOB错误率曲线变化情况,保留最终特征排序排名靠前的特征。2.如权利要求1所述的一种暂态评估特征选择方法,其特征在于,所述步骤II的所述特征重要性的计算包括:用Gini系数衡量分裂过程中节点n的样本不纯度;计算分裂后节点n的样本不纯度的下降量;根据样本不纯度的下降量,确定特征变量Xi的特征重要性。3.如权利要求2所述的一种暂态评估特征选择方法,其特征在于,所述节点n的样本不纯度i如下式所示:其中,p(j)为节点n中属于类别j的样本所占的比例。4.如权利要求2所述的一种暂态评估特征选择方法,其特征在于,所述节点n分裂为左子节点和右子节点,所述分裂后节点n的样本不纯度的下降量Δi如下式所示:Δi=i-(pleft·ileft+pright·iright)其中,i为节点n的样本不纯度;pleft为左子节点样本所占的比例;ileft为左子节点的样本不纯度;pright在右子节点样本所占的比例;iright为右子节点的样本不纯度。5.如权利要求2所述的一种暂态评估特征选择方法,其特征在于,特征变量Xi的特征重要性ΔI如下式所示:其中,Δik为第k个节点的不纯度的下降量。6.如权利要求1所述的一种暂态评估特征选择方法,其特征在于,所述步骤III包括:按随机森林生成决策树中用加权的线性集成方式,赋予不同类别样本数不同的权重,根据计算子节点最佳分离值和确定终节点的类标签,确定特征排序。7.如权利要求6所述的一种暂态评估特征选择方法,其特征在于,按下式计算未分裂的节点N的最佳分离值i(N):Δi=i(N)-i(NL)-i(NR)其中,ni为节点内i类样本的数量;Wi为第i类样本的类权重;Δi为不纯度的下降量;NL为分裂后的左子节点;NR为分裂后的右子节点。8.如权利要求6所述的一种暂态评估特征选择方法,其特征在于,所述终节点的类标签nodeclass如下式所示:2CN106897821A权利要求书2/3页其中,ni为节点内i类样本的数量;Wi为第i类样本的类权重。9.一种暂态评估特征选择装置,其特征在于,所述装置包括:模型建立模块,用于构建加权随机森林模型,得到特征重要性和袋外数据OOB错误率;计算模块,用于从计算的特征重要性中删除重要性最低的特征;确定模块,用于对删除后保留的特征进行最终特征排序;;执行模块,用于根据袋外数据OOB错误率曲线变化情况,保留最终特征排序排名靠前的特征。10.如权利要求9所述的一种暂态评估特征选择装置,其特征在于,所述计算模块,用于计算特征重要性,包括:用Gini系数衡量分裂过程中节点n的样本不纯度;计算分裂后节点n的样本不纯度的下降量;根据样本不纯度的下降量,确定特征变量Xi的特征重要性。11.如权利要求10所述的一种暂态评估特征选择装置,其特征在于,所述计算模块,计算的所述节点n的样本不纯度i如下式所示:其中,p(j)为节点n中属于类别j的样本所占的比例。12.如权利要求10所述的一种暂态评估特征选择装置,其特征在于,所述节点n分裂为左子节点和右子节点,所述计算模块,计算的所述分裂后节点n的样本不纯度的下降量Δi如下式所示:Δi