一种基于随机森林模型的报表生成方法及相关设备-豆柴文库

一种基于随机森林模型的报表生成方法及相关设备.pdf

2023-07-24

10金币

855KB

26页

Ma****57

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共26页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113901770A(43)申请公布日2022.01.07(21)申请号202111275770.3(22)申请日2021.10.29(71)申请人中国平安财产保险股份有限公司地址518000广东省深圳市福田区益田路5033号平安金融中心12、13、38、39、40层(72)发明人赵亚龙(74)专利代理机构广州三环专利商标代理有限公司44202代理人熊永强(51)Int.Cl.G06F40/183(2020.01)G06N3/00(2006.01)G06N20/00(2019.01)权利要求书3页说明书18页附图4页(54)发明名称一种基于随机森林模型的报表生成方法及相关设备(57)摘要本申请实施例应用于人工智能领域，公开了一种基于随机森林模型的报表生成方法及相关设备，包括：接收携带第一字段集合的报表生成指令，将第一字段集合输入至目标随机森林模型中；在确定第一字段集合所包括的字段能生成报表的情况下，确定目标随机森林模型中包括第一字段集合的路径集合；接收指示路径集合中第一路径的选择指令；确定在第一路径包括的各个节点对应的字段为第二字段集合；并根据第二字段集合中各个字段以及获取到的各个字段对应的数据，生成第一报表。采用本申请实施例，可以在面对多种不同业务以及海量数据快速生成报表，提高了生成报表的准确性和效率。本申请涉及区块链技术，上述报表/数据可存储于区块链中。CN113901770ACN113901770A权利要求书1/3页1.一种基于随机森林模型的报表生成方法，其特征在于，包括：接收报表生成指令，所述报表生成指令携带第一字段集合，将所述第一字段集合输入至目标随机森林模型中；在通过所述目标随机森林模型确定所述第一字段集合所包括的字段能生成报表的情况下，确定所述目标随机森林模型中包括所述第一字段集合的路径集合；接收选择指令，所述选择指令携带路径标识，所述路径标识用于指示所述路径集合中的第一路径，所述第一路径为所述目标随机森林模型中决策树模型的路径，所述第一路径包括所述决策树模型的根节点至目标叶子节点；确定在所述第一路径中的各个节点对应的字段为第二字段集合；获取所述第二字段集合中各个字段对应的数据，并根据所述第二字段集合中各个字段以及各个字段对应的数据，生成第一报表。2.根据权利要求1所述的方法，其特征在于，所述将所述第一字段集合中的各个字段输入至目标随机森林模型中之前，所述方法还包括：获取历史报表集合中的字段，并根据所述历史报表集合中字段确定第三字段集合；从所述第三字段集合中随机选取N个字段，将选取的N个字段组成训练样本，得到第一训练样本集，所述N为大于1的整数；在确定第二报表包括第一训练样本的N个字段的情况下，将所述第一训练样本确定为正样本，在确定所述第二报表不包括所述第一训练样本的N个字段的情况下，将所述第一训练样本确定为负样本；其中，所述第二报表为所述历史报表集合中的任一报表，所述第一训练样本为所述第一训练样本集中的任一训练样本。3.根据权利要求2所述的方法，其特征在于，所述将所述第一字段集合中的各个字段输入至目标随机森林模型之前，所述方法还包括：确定所述第一训练样本集中包括第一字段的第一正样本个数和第一负样本个数，并确定所述第一训练样本集中包括所述第一字段的第一总训练样本个数，确定所述第一训练样本集中不包括所述第一字段的第二正样本个数和第二负样本个数，以及确定所述第一训练样本集中不包括所述第一字段的第二总训练样本个数，所述第一字段为所述第三字段集合中的任一字段；其中，所述第一总训练样本个数为所述第一正样本个数与所述第一负样本个数之和，所述第二总训练样本个数为所述第二正样本个数与所述第二负样本个数之和；确定所述第一正样本个数占所述第一总训练样本个数的第一比例，确定所述第一负样本个数占所述第一总训练样本个数的第二比例，确定所述第二正样本个数占所述第二总训练样本个数的第三比例，确定所述第二负样本个数占所述第二总训练样本个数的第四比例；根据所述第一比例、所述第二比例、所述第三比例和所述第四比例，确定所述第一字段的第一基尼系数，并根据所述第一训练样本集合和所述第三字段集合中各个第一字段的第一基尼系数，构建第一决策树模型。4.根据权利要求3所述的方法，其特征在于，所述根据所述第三字段集合中各个第一字段的第一基尼系数，构建第一决策树模型之后，所述方法还包括：2CN113901770A权利要求书2/3页从所述第三字段集合中随机选取M个字段，并将选取的M个字段组成训练样本，得到第二训练样本集，所述M为大于1的整数；确定所述第三字段集合中各个字段的第二基尼系数，并根据所述第二训练样本集和所述第三字段集合中各个字段的第二基尼系数，构建第二决策树模型；将所述第一决策树模

相关资料

一种基于随机森林模型的报表生成方法及相关设备.pdf

本申请实施例应用于人工智能领域，公开了一种基于随机森林模型的报表生成方法及相关设备，包括：接收携带第一字段集合的报表生成指令，将第一字段集合输入至目标随机森林模型中；在确定第一字段集合所包括的字段能生成报表的情况下，确定目标随机森林模型中包括第一字段集合的路径集合；接收指示路径集合中第一路径的选择指令；确定在第一路径包括的各个节点对应的字段为第二字段集合；并根据第二字段集合中各个字段以及获取到的各个字段对应的数据，生成第一报表。采用本申请实施例，可以在面对多种不同业务以及海量数据快速生成报表，提高了生成报

2023-07-24

855KB

一种基于混淆矩阵的随机森林模型选择方法.pdf

本发明公开一种基于混淆矩阵的随机森林模型选择方法，包括：a.以训练得到的决策树作为原始随机森林，各决策树在测试样本集上进行分类，得到各决策树分类结果的混淆矩阵，通过对随机森林中决策树的混淆矩阵两两作差，得到随机森林中任意两棵决策树的差值矩阵；将差值矩阵的F范数作为两棵决策树的相似性度量，建立随机森林的差异性度量矩阵；c.遍历差异性度量矩阵中不大于相似性阈值的元素；考察该元素所涉及的决策树的分类准确率大小：若低于分类准确率阈值则删除该决策树，将该决策树所在的矩阵行列上的所有元素置零，否则保留该决策树；完成随

2023-11-20

306KB

一种基于随机森林模型的消防监督检查频率预测方法.docx

一种基于随机森林模型的消防监督检查频率预测方法引言随着社会的不断发展和城市化进程的加速，人们对城市公共安全的需求也越来越高。其中，消防安全是重中之重，一旦发生火灾，将会造成巨大的财产损失和人员伤亡，给社会和家庭带来严重的影响。因此，加强消防工作的监督和管理是十分必要的。如何针对性地制定合理的检查频率，是保证消防安全的重要手段。本文主要研究基于随机森林模型的消防监督检查频率预测方法，旨在为消防监管部门提供科学合理的检查计划，保障公共消防安全。一、随机森林模型简介随机森林(RandomForest)是一种基于

2024-10-15

11KB

一种基于随机森林的备件预测模型研究.docx

一种基于随机森林的备件预测模型研究引言在制造业中，备件的供应和采购是一项至关重要的工作。备件具有很大的经济价值，因此如何通过合理的预测来保证备件的供应充足和及时采购是非常重要的。另一方面，提高备件预测准确率也大大降低了备件库存成本，这对于企业来讲也是一个非常大的益处。因此，在备件供应链管理中，备件预测模型的研究是非常有价值的。为了提高备件预测的准确度和可靠性，本文研究一种基于随机森林的备件预测模型。随机森林算法是一种决策树的集成学习算法，它能够有效处理许多分类和回归问题，并且比传统的单棵决策树具有更高的准

2024-10-16

11KB

基于随机森林的房价预测模型.docx

基于随机森林的房价预测模型基于随机森林的房价预测模型摘要：随机森林是一种强大的集成学习模型，它能够通过组合多个决策树的预测结果来提高预测的准确性。在本论文中，我们利用随机森林算法来构建一个房价预测模型。首先，我们对房屋的各种特征进行了分析和处理，包括房屋面积、地理位置、建筑年份等。然后，我们使用随机森林算法对这些特征进行训练和预测，并评估模型的性能。结果表明，随机森林模型在房价预测方面具有较好的准确性和稳定性。1.引言随着城市化进程的加快，房地产市场越来越繁荣。房价预测作为房地产市场的重要组成部分，对于房

2024-11-01

11KB