预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共30页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111932041A(43)申请公布日2020.11.13(21)申请号202011069728.1(22)申请日2020.10.09(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人吕乐傅幸周璟宝鹏庆王维强(74)专利代理机构北京晋德允升知识产权代理有限公司11623代理人万铁占(51)Int.Cl.G06Q10/04(2012.01)G06Q10/06(2012.01)G06K9/62(2006.01)权利要求书5页说明书18页附图6页(54)发明名称基于风险识别的模型训练方法、装置和电子设备(57)摘要本说明书实施例公开了一种基于风险识别的模型训练方法、装置及电子设备,具体方案包括:获取无样本标签的第一数据集,第一数据集包含预期具有第一类样本标签的样本数据,在该预期具有第一类样本标签的样本数据中掺杂有具有第二类样本标签的样本数据;对第一数据集预配置第一类样本标签,利用该第一数据集运行配置有第一模型参数的目标模型,生成预测值。利用损失函数判断预测值相比于第一数据集所反映的目标值的损失量,估算损失量对应的第一数据集的统计中心估值,将统计中心估值转换成统计中心期望值,利用损失量和损失量对应的统计中心期望值调整第一模型参数,直到损失量达到预设条件。CN111932041ACN111932041A权利要求书1/5页1.一种基于风险识别的模型训练方法,包括:获取无样本标签的第一数据集,所述第一数据集包含预期具有第一类样本标签的样本数据,在所述预期具有第一类样本标签的样本数据中掺杂有具有第二类样本标签的样本数据;对所述第一数据集预配置所述第一类样本标签;利用预配置所述第一类样本标签的所述第一数据集运行配置有第一模型参数的目标模型,生成预测值;利用损失函数判断所述预测值相比于所述第一数据集所反映的目标值的损失量,所述损失函数包括所述第一模型参数和统计中心期望值;估算所述损失量对应的预配置所述第一类样本标签的所述第一数据集的统计中心估值;基于所述统计中心估值与统计中心期望值之间的约束关系,将所述统计中心估值转换成所述统计中心期望值;利用所述损失量和所述损失量对应的所述统计中心期望值调整所述第一模型参数,直到所述损失量达到预设条件。2.如权利要求1所述的方法,所述损失函数包含第一函数项和第二函数项,所述第一函数项和第二函数项均包含所述第一模型参数,所述第二函数项相比于所述第一函数项还包括所述统计中心期望值。3.如权利要求1所述的方法,估算所述损失量对应的预配置所述第一类样本标签的所述第一数据集的统计中心估值,包括:估算所述预配置所述第一类样本标签的所述第一数据集的第一统计中心估值;获取用于训练所述目标模型的实际具有所述第二类样本标签的第二数据集的第二统计中心估值;基于所述统计中心估值与统计中心期望值之间的约束关系,将所述统计中心估值转换成所述统计中心期望值,包括:基于所述第一统计中心估值与第一统计中心期望值之间的第一约束关系,将所述第一统计中心估值转换成所述第一统计中心期望值;基于所述第二统计中心估值与第二统计中心期望值之间的第二约束关系,将所述第二统计中心估值转换成所述第二统计中心期望值;所述损失函数还包含所述第二统计中心期望值,则利用所述损失量和所述损失量对应的所述统计中心期望值调整所述第一模型参数,包括:利用所述损失量和所述损失量对应的所述第一统计中心期望值和第二统计中心期望值调整所述第一模型参数。4.如权利要求3所述的方法,所述方法还包括:计算所述第一数据集中的各样本数据和所述各样本数据预配置的所述第一类样本标签之间的第一协方差,还计算所述第二数据集中的各样本数据和所述各样本数据具有的所述第二类样本标签之间的第二协方差;估算所述损失量对应的预配置所述第一类样本标签的所述第一数据集的统计中心估值,包括:2CN111932041A权利要求书2/5页利用所述第一统计中心估值、第一协方差与第一统计中心期望值之间的第一约束关系,将所述第一统计中心估值转换成所述第一统计中心期望值;利用所述第二统计中心估值、第二协方差与第二统计中心期望值之间的第二约束关系,将所述第二统计中心估值转换成所述第二统计中心期望值。5.如权利要求1所述的方法,利用预配置所述第一类样本标签的所述第一数据集运行配置第一模型参数的目标模型,包括:利用所述目标模型中配置的第二模型参数提取所述第一数据集中的特征信息,利用所述目标模型中配置的所述第一模型参数识别所述特征信息以生成所述预测值;估算所述损失量对应的预配置所述第一类样本标签的所述第一数据集的统计中心估值,包括:估算所述损失量对应的所述特征信息的所述统计中心估值;利用所述