预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113971527A(43)申请公布日2022.01.25(21)申请号202111263464.8(22)申请日2021.10.28(71)申请人平安医疗健康管理股份有限公司地址200001上海市黄浦区北京东路666号H区(东座)12G室(72)发明人谷志广(74)专利代理机构北京中强智尚知识产权代理有限公司11448代理人贾依娇(51)Int.Cl.G06Q10/06(2012.01)G06Q40/08(2012.01)G06N20/00(2019.01)权利要求书2页说明书11页附图4页(54)发明名称基于机器学习的数据风险评估方法及装置(57)摘要本发明涉及人工智能技术领域,揭露一种基于机器学习的数据风险评估方法,包括:获取不包含历史健康标签信息的目标保险数据;响应于目标保险数据的风险评估指令,使用预先设置的风险字段从所述目标保险数据中提取风险字段相应的字段属性;利用决策树算法从风险字段中选取目标风险字段,并结合目标风险字段相应的字段属性输入至预先构建的风险评估模型中进行预测,得到目标风险字段在不同风险规则条件上的映射关系;根据所述目标风险字段在不同风险规则条件上的映射关系,评估目标保险数据的风险概率。本发明能够利用风险评估模型快速筛查风险数据,提高数据风险评估的准确率和分析效率。CN113971527ACN113971527A权利要求书1/2页1.一种基于机器学习的数据风险评估方法,其特征在于,所述方法包括:获取不包含历史健康标签信息的目标保险数据;响应于目标保险数据的风险评估指令,使用预先设置的风险字段从所述目标保险数据中提取风险字段相应的字段属性;利用决策树算法从风险字段中选取目标风险字段,并结合目标风险字段相应的字段属性输入至预先构建的风险评估模型中进行预测,得到目标风险字段在不同风险规则条件上的映射关系;根据所述目标风险字段在不同风险规则条件上的映射关系,评估目标保险数据的风险概率。2.根据权利要求1所述的方法,其特征在于,所述获取不包含历史健康标签信息的目标保险数据,具体包括:通过将各个医疗数据平台接入服务端,由所述服务端向各个医疗数据平台发起查询请求,所述查询请求中携带有用户标识,所述医疗数据平台预先针对健康数据整理有与用户标识相匹配的历史健康标签信息;根据各个医疗数据平台反馈的查询请求结果,确定用户标识是否存在对应的历史健康标签信息;从保险数据集中筛选出不含历史健康标签信息的目标保险数据。3.根据权利要求1所述的方法,其特征在于,所述使用预先设置的风险字段从所述目标保险数据中提取风险字段相应的字段属性,具体包括:基于历史理赔数据统计信息结合模型特征工程经验,针对所述目标保险数据预先设置风险字段;从所述目标保险数据中提取风险字段相应的字段属性。4.根据权利要求3所述的方法,其特征在于,所述风险字段至少包括系统字段、开发衍生字段和设计字段,所述基于历史理赔数据统计信息结合模型特征工程经验,针对所述目标保险数据预先设置风险字段,具体包括:基于历史理赔数据统计信息结合模型特征工程经验,分别将从所述目标保险数据中直接获取到的字段信息作为系统字段,将通过所述目标保险数据推算得到的字段信息作为开发衍生字段,将针对所述目标保险数据额外定义的字段信息作为设计字段。5.根据权利要求1‑4中任一项所述的方法,其特征在于,在所述响应于目标保险数据的风险评估指令,使用预先设置的风险字段从所述目标保险数据中提取风险字段相应的字段属性之前,所述方法还包括:基于不包含历史健康标签信息的样本保险数据,利用决策树算法选取的目标风险字段与相应的字段属性输入至决策树网络模型中进行训练,构建风险评估模型,构建风险评估模型;所述利用决策树算法选取的目标风险字段与相应的字段属性输入至决策树网络模型中进行训练,构建风险评估模型,构建风险评估模型,具体包括:利用决策树算法自带模型特征重要属性的筛选功能对每个风险字段进行评估,选取对模型结果有贡献的目标风险字段;将所述目标风险字段形成特征向量输入至决策树网络模型中进行训练,提取风险字段2CN113971527A权利要求书2/2页在不同风险规则条件上的映射关系;根据所述风险字段在不同风险规则条件上的映射关系,构建风险评估模型。6.根据权利要求5所述的方法,其特征在于,所述将所述目标风险字段形成特征向量输入至决策树网络模型中进行训练,提取风险字段在不同风险规则条件上的映射关系,具体包括:将所述目标风险字段形成特征向量输入至决策树网络模型中进行训练,并使用决策树网络模型中节点判断风险字段是否达到节点设置的风险规则条件;若是,则更新风险字段在相应节点上的权重;通过汇总决策树中节点上的权重,提取风险字段在不同风险规则条件上的映射关系。7.