预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共24页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113971984A(43)申请公布日2022.01.25(21)申请号202010648024.3G06K9/62(2006.01)(22)申请日2020.07.07(71)申请人中移(苏州)软件技术有限公司地址215163江苏省苏州市高新区昆仑山路58号1幢申请人中国移动通信集团有限公司(72)发明人钱宝健(74)专利代理机构北京派特恩知识产权代理有限公司11270代理人王姗姗张颖玲(51)Int.Cl.G16B5/00(2019.01)G16B20/30(2019.01)G16B25/10(2019.01)G16B40/00(2019.01)权利要求书2页说明书13页附图8页(54)发明名称分类模型构建方法及装置、电子设备、存储介质(57)摘要本申请公开了一种分类模型构建方法,所述方法包括:获取目标对象样本集,并提取所述目标对象样本集的目标特征信息;确定所述目标特征信息的多个分裂属性;其中,所述分裂属性用于表征所述目标对象样本集中类别分裂节点的属性;确定所述多个分裂属性分别对应的权重值,并从所述多个分裂属性中获取权重值最大的部分目标分裂属性;所述权重值用于表征分裂属性的类别区分度;基于所述目标特征信息和所述目标分裂属性,构建目标对象的分类模型。本申请提供的分类模型构建方法,能够提高分类模型的训练效率,缩短训练时间,降低计算开销。本申请同时公开了一种分类模型构建装置、电子设备以及计算机可读存储介质。CN113971984ACN113971984A权利要求书1/2页1.一种分类模型构建方法,其特征在于,所述方法包括:获取目标对象样本集,并提取所述目标对象样本集的目标特征信息;确定所述目标特征信息的多个分裂属性;其中,所述分裂属性用于表征所述目标对象样本集中类别分裂节点的属性;确定所述多个分裂属性分别对应的权重值,并从所述多个分裂属性中获取权重值最大的部分目标分裂属性;所述权重值用于表征分裂属性的类别区分度;基于所述目标特征信息和所述目标分裂属性,构建所述目标对象的分类模型。2.根据权利要求1所述的方法,其特征在于,所述分类模型为深度森林模型,其中,所述深度森林模型包括N层级联森林;N为大于1的整数;所述基于所述目标分裂属性和所述目标特征信息,构建所述目标对象的分类模型,包括:将所述目标特征信息以及所述目标分裂属性,作为深度森林模型的输入,并对所述深度森林模型中每一层级联森林进行训练和测试,得到训练好的深度森林模型;将所述训练好的深度森林模型作为所述目标对象的分类模型。3.根据权利要求2所述的方法,其特征在于,所述将所述目标特征信息和所述目标分裂属性作为深度森林模型的输入,对所述深度森林模型中每一层级联森林进行训练和测试,得到训练好的深度森林模型,包括:将所述目标特征信息输入至深度森林模型的第一层级联森林,对所述第一层随机森林进行训练和测试,得到第1类别向量;将第i类别向量和所述目标分裂属性对应的分裂特征向量作为第i+1层级联森林的输入,对所述第i+1层级联森林进行训练和测试,得到第i+1类别向量;其中,所述分裂特征向量用于表征目标特征信息中划分至目标分裂属性的特征向量;继续将所述第i+1类别向量和所述目标分裂属性对应的分裂特征向量作为第i+2层级联森林的输入,对所述第i+2层随机森林进行训练和测试,直到对第N层级联森林训练和测试完毕为止;其中i为大于等于1且小于N-1的整数。4.根据权利要求2或3所述的方法,其特征在于,所述将所述目标特征信息和所述目标分裂属性作为深度森林模型的输入之前,还包括:接收针对所述深度森林模型的配置信息;基于所述配置信息确定所述深度森林模型中包括的级联森林的最大层数N,每一层级联森林中随机森林的个数M,以及每个随机森林的决策树个数L。5.根据权利要1-3任一项所述的方法,其特征在于,所述目标对象包括基因表达数据。6.根据权利要求5所述的方法,其特征在于,所述获取目标对象样本集之前,包括:获取多个基因表达数据;对所述多个基因表达数据进行预处理,得到所述目标对象样本集;所述预处理包括:对所述基因表达数据进行空缺值处理和/或标准化处理。7.根据权利要求1-3任一项所述的方法,其特征在于,所述提取所述目标对象样本集的目标特征信息,包括:根据预设特征选择方法提取所述目标对象样本集的目标特征信息;其中,所述预设特征选择方法用于降低所述目标对象的维度。2CN113971984A权利要求书2/2页8.根据权利要求7所述的方法,其特征在于,所述预设特征选择方法包括以下至少之一:T检验方法,费歇Fisher判别法,类别相关特征法,以及遗传算法。9.根据权利要求2所述的方法,其特征在于,所述获取目标对象样本集之后,还包括:将所述目标对象样本集划