预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111984704A(43)申请公布日2020.11.24(21)申请号202010842635.1(22)申请日2020.08.20(71)申请人支付宝(杭州)信息技术有限公司地址310013浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人单硕陈琪(74)专利代理机构北京智信禾专利代理有限公司11637代理人李晓庆(51)Int.Cl.G06F16/2458(2019.01)G06Q10/10(2012.01)权利要求书2页说明书14页附图3页(54)发明名称数据筛选方法及装置(57)摘要本说明书提供数据筛选方法及装置,其中数据筛选方法包括:获取待审核业务数据,为待审核业务数据构造抽样审核标识序列,并以抽样审核标识序列作为亲代样本;对亲代样本进行交叉操作,确定交叉样本;并对交叉样本进行变异操作,确定变异样本;将继承样本、交叉样本和变异样本确定为子代样本;将子代样本作为亲代样本迭代执行确定继承样本、交叉样本和变异样本的步骤,在满足迭代停止条件的情况下,根据当前最优样本确定待审核业务数据中的目标审核业务数据。该目标审核业务数据代表最少需要治理的业务数据,后续只需要对该目标审核业务数据进行合规性治理即可,无需对全部的待审核业务数据一一进行审核治理,大大节省了时间。CN111984704ACN111984704A权利要求书1/2页1.一种数据筛选方法,包括:获取待审核业务数据,为所述待审核业务数据构造抽样审核标识序列,并以所述抽样审核标识序列作为亲代样本,其中,所述抽样审核标识序列的长度与所述待审核业务数据的个数相同,所述抽样审核标识序列中的每一位与一个待审核业务数据对应;确定所述亲代样本中的继承样本;对所述亲代样本进行交叉操作,确定交叉样本;并对所述交叉样本进行变异操作,确定变异样本;将所述继承样本、交叉样本和变异样本确定为子代样本;将所述子代样本作为亲代样本迭代执行确定继承样本、交叉样本和变异样本的步骤,在满足迭代停止条件的情况下,根据当前最优样本确定所述待审核业务数据中的目标审核业务数据。2.根据权利要求1所述的数据筛选方法,所述为所述待审核业务数据构造抽样审核标识序列,包括:根据所述待审核业务数据的个数,通过预先存储的业务数据的个数与抽样审核标识序列的个数之间的对应关系,确定对应的目标个数;为所述待审核业务数据构造所述目标个数个抽样审核标识序列。3.根据权利要求1所述的数据筛选方法,所述确定所述亲代样本中的继承样本,包括:确定每个所述亲代样本的适应度;根据所述适应度,从所述亲代样本中确定所述继承样本。4.根据权利要求3所述的数据筛选方法,所述确定每个所述亲代样本的适应度,包括:针对任一亲代样本,确定所述亲代样本中第一标识的个数;确定所述待审核业务数据的约束指标,根据所述亲代样本中包括的标识序列和对应的待审核业务数据的约束指标,确定阈值参数;根据所述第一标识的个数和所述阈值参数,确定所述亲代样本的适应度。5.根据权利要求1所述的数据筛选方法,所述对所述亲代样本进行交叉操作,确定交叉样本,包括:从所述亲代样本中任意选取两个第一目标样本;针对选取的所述两个第一目标样本,按照预设交叉规则进行交叉,确定一个交叉样本;循环执行确定一个交叉样本的步骤,直至确定第一预设数值个交叉样本。6.根据权利要求5所述的数据筛选方法,所述针对选取的所述两个第一目标样本,按照预设交叉规则进行交叉,确定一个交叉样本,包括:确定交叉位点;从所述两个第一目标样本中的一个目标样本中抽取所述交叉位点之前的标识,并从所述两个目标样本中的另一个目标样本中抽取所述交叉位点之后的标识;将抽取的所述标识组成的标识序列确定为所述交叉样本。7.根据权利要求1、5或6所述的数据筛选方法,所述对所述交叉样本进行变异操作,确定变异样本,包括:从所述交叉样本中任意选取一个第二目标样本;针对所述第二目标样本,按照预设变异规则对所述第二目标样本中包括的标识进行变异操作,确定一个变异样本;2CN111984704A权利要求书2/2页循环执行确定一个变异样本的步骤,直至确定第二预设数值个变异样本。8.根据权利要求7所述的数据处理方法,所述按照预设变异规则对所述第二目标样本中包括的标识进行变异操作,确定一个变异样本,包括:从所述第二目标样本中选取第三预设数值个变异标识;为所述第二目标样本重新构造第三预设数值个替换标识;针对所述第二目标样本,用所述替换标识替换所述变异标识,确定所述变异样本。9.根据权利要求3所述的数据处理方法,所述在满足迭代停止条件的情况下,根据当前最优样本确定所述待审核业务数据中的目标审核业务数据,包括:在迭代至预设迭代次数的情况下,确定子代样本中最优样本和最差样本之间的适应度差值,