预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114978616A(43)申请公布日2022.08.30(21)申请号202210486217.2(22)申请日2022.05.06(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人张长浩傅欣艺王维强(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309专利代理师陈婧玥周良玉(51)Int.Cl.H04L9/40(2022.01)G06F21/57(2013.01)权利要求书3页说明书10页附图3页(54)发明名称风险评估系统的构建方法及装置、风险评估方法及装置(57)摘要本说明书实施例提供一种风险评估系统的构建方法,包括:利用第一标注事件样本集训练第一风险评估模型,所述第一标注事件样本集中包括第一数量的黑样本和第二数量的白样本,所述第一数量大于第二数量;利用训练好的第一风险评估模型处理多个灰样本,得到其中各个灰样本的预测风险分,所述各个灰样本被已有的风控技术识别为风险样本;基于所述预测风险分,从所述多个灰样本中选取部分灰样本,作为对第二标注事件样本集中黑样本的扩充;所述第二标注事件样本集中初始包括第三数量的黑样本和第四数量的白样本,所述第三数量小于第四数量;利用扩充后的第二标注事件样本集训练第二风险评估模型,训练好的第二风险评估模型用于构建所述风险评估系统。CN114978616ACN114978616A权利要求书1/3页1.一种风险评估系统的构建方法,包括:利用第一标注事件样本集训练第一风险评估模型;所述第一标注事件样本集中包括第一数量的黑样本和第二数量的白样本,所述第一数量大于第二数量;利用训练好的第一风险评估模型处理多个灰样本,得到其中各个灰样本的预测风险分;所述各个灰样本被已有的风控技术识别为风险样本;基于所述预测风险分,从所述多个灰样本中选取部分灰样本,作为对第二标注事件样本集中黑样本的扩充;所述第二标注事件样本集中初始包括第三数量的黑样本和第四数量的白样本,所述第三数量小于第四数量;利用扩充后的第二标注事件样本集训练第二风险评估模型;训练好的第二风险评估模型用于构建所述风险评估系统。2.根据权利要求1所述的方法,其中,在利用第一标注事件样本集训练第一风险评估模型之前,所述方法还包括:将所述第二标注事件样本集拆分为两个标注子集;利用所述两个标注子集对应训练两个风险评估模型,用于构建所述风险评估系统;利用训练好的两个风险评估模型对所述两个标注子集进行交叉打分,得到所述第二标注事件样本集中各个标注样本的预测风险分;基于所述各个标注样本的预测风险分,从所述第二标注样集中选取所述第一数量的黑样本和第二数量的白样本,形成所述第一标注事件样本集。3.根据权利要求2所述的方法,其中,基于所述各个标注样本的预测风险分,从所述第二标注样集中选取所述第一数量的黑样本和第二数量的白样本,包括:对所述各个标注样本的预测风险分进行倒排序;根据所述倒排序的结果,从所述多个黑样本中选取排在靠前位置的所述第一数量的黑样本,以及,从所述多个白样本中选取排在靠后位置的所述第二数量的白样本。4.根据权利要求2所述的方法,其中,在得到所述第二标注事件样本集中各个标注样本的预测风险分之后,所述方法还包括:针对所述各个标注样本,在该标注样本为黑样本的情况下,若其预测风险分小于第一阈值,则将其从所述第二标注事件样本集中剔除,或者,在该标注样本为白样本的情况下,若其预测风险分大于第二阈值,则将其从所述第二标注事件样本集中剔除;基于进行剔除处理后的第二标注事件样本集训练第三风险评估模型;训练好的第三风险评估模型用于构建所述风险评估系统。5.根据权利要求2所述的方法,其中,在将包含多个黑样本和多个白样本的第二标注事件样本集拆分为两个标注子集之前,所述方法还包括:获取对应第一历史时段的第三标注事件样本集,以及,获取对应第二历史时段的第四标注事件样本集;所述第一历史时段早于所述第二历史时段;利用所述第三标注事件样本集训练第四风险评估模型,并利用训练好的第四风险评估模型对所述第四标注事件样本集进行预测,得到其中各个第四标注样本的预测风险分;针对所述各个第四标注样本,利用其预测风险分对其进行特征扩充,得到对应的第五标注样本,用于形成所述第二标注事件样本集。6.根据权利要求5所述的方法,其中,在利用所述第三标注样本训练第四风险评估模型2CN114978616A权利要求书2/3页之前,所述方法还包括:针对所述第三标注事件样本集中的各个第三标注样本,按照预设方式对其进行特征维度的拆分,得到预定数量的子样本,对应归入预定数量的子样本集;其中,所述第四风险评估模型包括所述预定数量的子模型;其中,利用所述第三标注样本训练第四风险评估