预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114493885A(43)申请公布日2022.05.13(21)申请号202210321635.6(22)申请日2022.03.30(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人顾咏丰丁皓吴华(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309专利代理师陈霁周良玉(51)Int.Cl.G06Q40/04(2012.01)G06Q40/02(2012.01)权利要求书2页说明书9页附图2页(54)发明名称策略组合的优化方法及装置(57)摘要本说明书实施例提供一种策略组合的优化方法及装置。所述方法涉及对用于识别风险用户的策略组合的多轮次迭代更新,其中任一轮次包括:在当前策略组合的基础上分别添加多个可选策略,得到多个第一策略组合;对伯努利分布进行随机采样;在采样结果指示本轮接受次优策略的情况下,基于所述多个第一策略组合随机选取某个第一策略组合,作为本轮更新后的当前策略组合。CN114493885ACN114493885A权利要求书1/2页1.一种策略组合的优化方法,涉及对用于识别风险用户的策略组合的多轮次迭代更新,其中任一轮次包括:在当前策略组合的基础上分别添加多个可选策略,得到多个第一策略组合;对伯努利分布进行随机采样;在采样结果指示本轮接受次优策略的情况下,基于所述多个第一策略组合随机选取某个第一策略组合,作为本轮更新后的当前策略组合。2.根据权利要求1所述的方法,其中,在当前策略组合的基础上分别添加多个可选策略,得到多个第一策略组合,包括:针对策略总集中未被包含在所述当前策略组合中的各个可选策略,将其分别添加至该当前策略组合,得到多个第一策略组合。3.根据权利要求1所述的方法,其中,对伯努利分布进行随机采样,包括:根据本轮对应的轮次数,确定本轮接受次优策略的概率,此概率与所述轮次数负相关;对以所述概率为参数的伯努利分布进行所述随机采样。4.根据权利要求1所述的方法,其中,对伯努利分布进行随机采样,包括:确定各个第一策略组合针对多个风险用户样本的识别效果评分;根据所述多个第一策略组合对应的多个识别效果评分中最小值减去最大值而得到的差值,确定所述概率,此概率与所述差值正相关;对以所述概率为参数的伯努利分布进行所述随机采样。5.根据权利要求1所述的方法,其中,基于所述多个第一策略组合随机选取某个第一策略组合,包括:根据各个第一策略组合针对多个风险用户样本的识别效果评分,从所述多个第一策略组合中确定出识别效果评分排在预设名次范围内的多个第二策略组合;从所述多个第二策略组合中随机选取出某个第二策略组合,对应某个第一策略组合。6.根据权利要求5所述的方法,其中,从所述多个第二策略组合中随机选取出某个第二策略组合,包括:确定各个第二策略组合本轮被选中的概率,形成对应的概率分布;通过对所述概率分布进行随机抽样,得到所述某个第二策略组合。7.根据权利要求6所述的方法,其中,确定各个第二策略组合本轮被选中的概率,包括:针对所述各个第二策略组合,根据其识别效果评分确定其本轮被选中的概率,此概率与其识别效果评分正相关。8.根据权利要求6所述的方法,其中,确定各个第二策略组合本轮被选中的概率,形成对应的概率分布,包括:根据所述多个第二策略组合的数量,确定所述各个第二策略组合本轮被选中的概率,形成均匀分布。9.根据权利要求1所述的方法,其中,在对伯努利分布进行随机采样后,还包括:在采样结果指示本轮不接受次优策略的情况下,根据各个第一策略组合针对多个风险用户样本的识别效果评分,选取识别效果评分最高的第一策略组合,作为本轮更新后的当前策略组合。10.一种策略组合的优化方法,涉及对用于执行目标判别任务的策略组合的多轮次迭2CN114493885A权利要求书2/2页代更新,其中任一轮次包括:在当前策略组合的基础上分别添加多个可选策略,得到多个第一策略组合;对伯努利分布进行随机采样;在采样结果指示本轮接受次优策略的情况下,基于所述多个第一策略组合随机选取某个第一策略组合,作为本轮更新后的当前策略组合。11.根据权利要求10所述的方法,其中,对伯努利分布进行随机采样,包括:确定各个第一策略组合针对多个任务标注样本的识别效果评分;根据所述多个第一策略组合对应的多个识别效果评分中最小值减去最大值而得到的差值,确定所述概率,此概率与所述差值正相关;对以所述概率为参数的伯努利分布进行所述随机采样。12.一种策略组合的优化装置,所述装置通过其包含的以下单元,执行对用于识别风险用户的策略组合的多轮次迭代更新中的任一轮次:策略添加单元,配置为在当前策略组合的基础上分别添加多个可选策略,得到多个第一策略组合;随机采样单元,