预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113971604A(43)申请公布日2022.01.25(21)申请号202010712803.5(22)申请日2020.07.22(71)申请人中移(苏州)软件技术有限公司地址215163江苏省苏州市高新区昆仑山路58号1幢申请人中国移动通信集团有限公司(72)发明人黄晓娟章及第(74)专利代理机构北京派特恩知识产权代理有限公司11270代理人张静张颖玲(51)Int.Cl.G06Q40/02(2012.01)G06K9/62(2022.01)权利要求书2页说明书14页附图2页(54)发明名称数据处理方法、装置和存储介质(57)摘要本发明公开了一种数据处理方法、装置和存储介质,方法包括:获取第一待评估数据,对所述第一待评估数据进行标准化处理,得到标准化处理后的第一待评估数据;从所述标准化处理后的第一待评估数据中选择目标属性对应的属性值,将包含所述目标属性对应的属性值作为第二待评估数据;所述目标属性为基于第一训练样本集确定的符合分类要求的属性;运用预设的数据处理模型识别所述第二待评估数据,得到评估结果。本发明提供的方法基于目标属性对第一待评估数据进行筛选,以删除噪声数据,从而提高评估效果。CN113971604ACN113971604A权利要求书1/2页1.一种数据处理方法,其特征在于,所述方法包括:获取第一待评估数据,对所述第一待评估数据进行标准化处理,得到标准化处理后的第一待评估数据;从所述标准化处理后的第一待评估数据中选择目标属性对应的属性值,将包含所述目标属性对应的属性值作为第二待评估数据;所述目标属性为基于第一训练样本集确定的符合分类要求的属性;运用预设的数据处理模型识别所述第二待评估数据,得到评估结果。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:生成预设的数据处理模型;所述生成预设的数据处理模型,包括:获取第一训练样本集;所述第一训练样本集包括:至少一个第一训练样本;所述至少一个第一训练样本中各第一训练样本包括:至少一个属性和所述至少一个属性中各属性对应的属性值;对所述第一训练样本集进行标准化处理,得到第二训练样本集;所述第二训练样本集包括:至少一个第二训练样本;所述至少一个第二训练样本中各第二训练样本包括:至少一个属性和所述至少一个属性中各属性对应的标准化处理后的属性值;根据所述第二训练样本集,确定权重向量;所述权重向量包括所述第二训练样本集中存在的所述至少一个属性的权重;根据所述权重向量,对所述至少一个属性进行排序,根据排序结果确定目标属性集;所述目标属性集包括至少一个目标属性;根据所述目标属性集对所述第二训练样本集进行筛选,得到第三训练样本集;所述第三训练样本集包括:至少一个第三训练样本;所述至少一个第三训练样本中各第三训练样本包括:至少一个目标属性和所述至少一个目标属性中各目标属性对应的标准化处理后的属性值;基于所述第三训练样本集进行建模,得到数据处理模型。3.根据权利要求2所述的方法,其特征在于,所述对所述第一训练样本集进行标准化处理,得到第二训练样本集,包括:确定所述第一训练样本集对应的第一属性集;所述第一属性集包括:至少一个属性和所述至少一个属性中各属性对应的属性值;根据所述第一属性集确定所述第一属性集中各属性对应的最大属性值和最小属性值;根据各训练样本对应的各属性的初始属性值、各属性对应的最大属性值和最小属性值,确定各样本对应的各属性的目标属性值,作为标准化处理后的属性值。4.根据权利要求2所述的方法,其特征在于,所述根据所述第二训练样本集,确定权重向量,包括:确定所述第二训练样本集中各第二训练样本与异类样本中的近邻样本矩阵之间的第一差距,及各第二训练样本与同类样本中的近邻样本矩阵之间的第二差距;根据初始的权重向量、所述第二训练样本集中各第二训练样本对应的第一差距和第二差距之间的差值建立优化函数;以所述优化函数最大化为目标进行迭代,确实所述权重向量。5.根据权利要求2所述的方法,其特征在于,所述根据所述权重向量,对所述至少一个2CN113971604A权利要求书2/2页属性进行排序,根据排序结果确定目标属性集;包括:根据所述权重向量中各属性对应的权重值对所述至少一个属性进行排序,得到排序后的属性;基于排序后的属性,运用支持向量机分类器在所述第二训练样本集上进行十折交叉验证,确定符合分类要求的目标属性集;所述目标属性集包括至少一个目标属性。6.根据权利要求2所述的方法,其特征在于,所述基于所述第三训练样本集进行建模,得到数据处理模型,包括:采用支持向量机对所述第三训练样本集进行建模,得到数据处理模型。7.一种数据处理装置,其特征在于,所述装置包括:第一处理模块、第二处理模块和第三处理模块;其中,所述第一处理模