预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115099875A(43)申请公布日2022.09.23(21)申请号202210836961.0G06F16/28(2019.01)(22)申请日2022.07.15(71)申请人平安科技(深圳)有限公司地址518000广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼(72)发明人钱学广(74)专利代理机构深圳市世联合知识产权代理有限公司44385专利代理师姜妍(51)Int.Cl.G06Q30/02(2012.01)G06Q40/08(2012.01)G06K9/62(2022.01)G06F16/2458(2019.01)权利要求书2页说明书15页附图4页(54)发明名称基于决策树模型的数据分类方法及相关设备(57)摘要本申请实施例属于人工智能技术领域,涉及一种基于决策树模型的数据分类方法及相关设备,包括从获取的历史业务数据中提取业务特征生成数据集,并从数据集中提取子集作为第一训练数据集;确定第一训练数据集中的指标属性和条件属性,基于指标属性确定第一训练数据集的第一总信息熵;根据第一总信息熵和条件属性生成节点,基于节点生成决策树模型;通过验证数据集对决策树模型进行验证,得到验证结果,直到验证结果满足预设条件,输出最终决策树模型作为分类预测模型;将目标业务数据输入分类预测模型,得到分类结果。此外,本申请还涉及区块链技术,业务特征可存储于区块链中。本申请可以提高对业务数据的分类效率和分类准确性。CN115099875ACN115099875A权利要求书1/2页1.一种基于决策树模型的数据分类方法,其特征在于,包括下述步骤:获取历史业务数据,从所述历史业务数据中提取业务特征,根据所述业务特征生成数据集,并从所述数据集中提取子集作为第一训练数据集;确定所述第一训练数据集中的指标属性和条件属性,基于所述指标属性确定所述第一训练数据集的第一总信息熵;根据所述第一总信息熵和所述条件属性生成节点,基于所述节点生成决策树模型;从所述数据集中获取验证数据集,通过所述验证数据集对所述决策树模型进行验证,得到验证结果;确定所述验证结果是否满足预设条件,若所述验证结果不满足预设条件,则更新所述决策树模型,直到所述验证结果满足预设条件,输出最终决策树模型作为分类预测模型;获取目标业务数据,将所述目标业务数据输入所述分类预测模型,得到分类结果。2.根据权利要求1所述的基于决策树模型的数据分类方法,其特征在于,所述基于所述指标属性确定所述第一训练数据集的第一总信息熵的步骤包括:确定所述指标属性中每个指标特征在所述第一训练数据集中的概率;基于所述概率计算得到所述第一训练数据集的第一总信息熵。3.根据权利要求1所述的基于决策树模型的数据分类方法,其特征在于,所述根据所述第一总信息熵和所述条件属性生成节点的步骤包括:步骤A,根据所述第一总信息熵和所述条件属性的属性数据,计算得到每个所述条件属性的信息增益;步骤B,获取所述条件属性的优化权值,通过所述优化权值优化对应的信息增益,得到优化信息增益;步骤C,基于所述优化信息增益确定最优条件属性,并将所述最优条件属性作为节点;步骤D,将所述节点之外的条件属性和所述指标属性组成第二训练数据集,根据所述指标属性计算所述第二训练数据集的第二总信息熵;步骤E,循环步骤A至步骤D,直至所有的所述条件属性生成节点。4.根据权利要求3所述的基于决策树模型的数据分类方法,其特征在于,所述根据所述第一总信息熵和所述条件属性的属性数据,计算每个所述条件属性的信息增益的步骤包括:根据所述属性数据,计算每个所述条件属性中每个属性特征的属性信息熵;基于所述属性信息熵计算得到对应所述条件属性的条件信息熵;根据所述第一总信息熵和所述条件信息熵,计算得到信息增益。5.根据权利要求3所述的基于决策树模型的数据分类方法,其特征在于,在所述根据所述第一总信息熵和所述条件属性的属性数据,计算得到每个所述条件属性的信息增益的步骤之前还包括:确定所述属性数据是否存在异常数据;若存在异常数据,则对所述异常数据进行修正。6.根据权利要求5所述的基于决策树模型的数据分类方法,其特征在于,在所述获取所述条件属性的优化权值的步骤之前还包括:确定所述异常数据对应的条件属性,统计所述异常数据在所述条件属性中的占比;2CN115099875A权利要求书2/2页根据所述占比计算得到调整系数,根据所述调整系数调整所述条件属性的优化权值。7.根据权利要求1所述的基于决策树模型的数据分类方法,其特征在于,所述通过所述验证数据集对所述决策树模型进行验证,得到验证结果的步骤包括:将所述验证数据集输入所述决策树模型,输出预测结果;根据所述预测结果计算预测准确度,将所述预测准确度作为验证结果。8.一种基于决