预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115409127A(43)申请公布日2022.11.29(21)申请号202211152021.6(22)申请日2022.09.21(71)申请人中国农业银行股份有限公司地址100005北京市东城区建国门内大街69号(72)发明人谢波周成阳蒋洪伟严欢(74)专利代理机构北京集佳知识产权代理有限公司11227专利代理师杨傥月(51)Int.Cl.G06K9/62(2022.01)G06Q10/06(2012.01)权利要求书2页说明书12页附图1页(54)发明名称一种合同违约风险预测模型的训练方法和相关装置(57)摘要本申请公开了一种合同违约风险预测模型的训练方法和相关装置,获取训练集,该训练集包括至少一条有标签的第一样本数据和至少一条无标签的第二样本数据。基于第一样本数据,通过有监督学习的方式训练得到初始合同违约风险预测模型,并将第二样本数据输入至初始合同违约风险预测模型中,得到第二样本数据的伪标签,基于具有伪标签的第二样本数据和第一样本数据,通过半监督学习的方式训练得到合同违约风险预测模型,以便基于合同违约风险预测模型预测合同数据的违约风险。由此,通过给无标签的第二样本数据附上伪标签,从而避免了人工标记,不仅可以快速得到合同违约风险预测模型,还能够降低人工打标的成本。CN115409127ACN115409127A权利要求书1/2页1.一种合同违约风险预测模型的训练方法,其特征在于,所述方法包括:获取训练集,所述训练集包括至少一条有标签的第一样本数据和至少一条无标签的第二样本数据,标签用于标识所述第一样本数据是否具有违约风险;基于所述第一样本数据,通过有监督学习的方式训练得到初始合同违约风险预测模型;将所述第二样本数据输入至所述初始合同违约风险预测模型中,得到所述第二样本数据的伪标签;基于具有所述伪标签的第二样本数据和所述第一样本数据,通过半监督学习的方式训练得到合同违约风险预测模型,其中,在通过所述半监督学习的方式训练的过程中调整所述伪标签,所述合同违约风险预测模型用于预测合同数据的违约风险。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取具有违约风险的合同数据的多个合同要素,所述多个合同要素包括合同名称、合同文本、合同业务类型、发文文号、发文日期、制定机构、失效性和适用产品中的多种组合。从所述多个合同要素中筛选出关键合同要素,所述关键合同要素与所述合同数据的违约率间的相关性超过预设阈值;基于所述关键合同要素确定样本数据,所述样本数据包括第一样本数据和所述第二样本数据。3.根据权利要求1所述的方法,其特征在于,所述基于具有所述伪标签的第二样本数据和所述第一样本数据,通过半监督学习的方式训练得到合同违约风险预测模型,包括:确定具有约束的损失函数,所述约束包括用于降低复杂度的第一约束、用于防止陷入局部最优的第二约束和用于成对约束监督的第三约束中的一个或多个组合;基于具有所述伪标签的第二样本数据和所述第一样本数据,通过半监督学习的方式训练使得所述具有约束的损失损失函数最小,得到所述合同违约风险预测模型。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取测试集,所述测试集包括至少一条有标签的第三样本数据;所述基于具有所述伪标签的第二样本数据和所述第一样本数据,通过半监督学习的方式训练得到合同违约风险预测模型,包括:基于具有所述伪标签的第二样本数据、所述第一样本数据和所述测试集,通过半监督学习的方式训练得到合同违约风险预测模型。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:获取通过多个集合分别训练得到的多个待选的合同违约风险预测模型,所述集合为不同的测试集和训练集的组合;通过广义交互验证的方式从所述多个待选的合同违约风险预测模型中确定合同违约风险预测模型。6.根据权利要求1‑5任意一项所述的方法,其特征在于,所述方法还包括:获取待预测的合同数据;将所述待预测的合同数据输入至所述合同违约风险预测模型中,得到所述待预测的合同数据对应的违约率。7.一种合同违约风险预测模型的训练装置,其特征在于,所述装置包括:获取单元、有2CN115409127A权利要求书2/2页监督训练单元、第一预测单元和半监督训练单元;所述获取单元,用于获取训练集,所述训练集包括至少一条有标签的第一样本数据和至少一条无标签的第二样本数据,标签用于标识所述第一样本数据是否具有违约风险;所述有监督训练单元,用于基于所述第一样本数据,通过有监督学习的方式训练得到初始合同违约风险预测模型;所述第一预测单元,用于将所述第二样本数据输入至所述初始合同违约风险预测模型中,得到所述第二样本数据的伪标签;所述半监督训练单元,用于基于具有所述伪标签的第二样本数据和所述第一样本数据,通过