预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111538767A(43)申请公布日2020.08.14(21)申请号202010467156.6(22)申请日2020.05.28(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人张震(74)专利代理机构北京东方亿思知识产权代理有限责任公司11258代理人赵秀芹(51)Int.Cl.G06F16/2458(2019.01)G06F16/23(2019.01)G06N3/12(2006.01)权利要求书2页说明书13页附图4页(54)发明名称数据处理方法、装置、设备及存储介质(57)摘要本说明书的一个或多个实施例公开了一种数据处理方法、装置、设备及存储介质,该数据处理方法包括:获取服务数据的多个待处理特征;根据多个待处理特征,构建特征种群,特征种群包括多个数据序列,特征种群中的一个数据序列对应一个包括至少一个待处理特征的特征组;利用预定的损失函数,计算特征种群中的每个数据序列的适应度;根据适应度更新特征种群,并利用损失函数对更新后的特征种群中的每个数据序列的适应度进行迭代计算,直到满足预定条件为止;在满足预定条件的情况下,根据最近一次更新的特征种群,确定数据挖掘模型的目标输入特征。根据本说明书实施例,能够合理地选择数据挖掘模型的输入特征。CN111538767ACN111538767A权利要求书1/2页1.一种数据处理方法,包括:获取服务数据的多个待处理特征;根据所述多个待处理特征,构建特征种群,其中,所述特征种群包括多个数据序列,所述特征种群中的一个数据序列对应一个包括至少一个待处理特征的特征组;利用预定的损失函数,计算所述特征种群中的每个数据序列的适应度,所述适应度用于表征所述特征种群中数据序列的优劣程度;根据所述适应度更新所述特征种群,并利用所述损失函数对更新后的所述特征种群中的每个数据序列的适应度进行迭代计算,直到满足预定条件为止;在满足所述预定条件的情况下,根据最近一次更新的所述特征种群,确定数据挖掘模型的目标输入特征。2.根据权利要求1所述的方法,其中,所述根据最近一次更新的所述特征种群,确定数据挖掘模型的目标输入特征,包括:在最近一次更新的所述特征种群中获取目标数据序列;根据预先建立的数据序列与特征组之间的对应关系,获取所述目标数据序列所对应的目标特征组;将所述目标特征组中的特征确定为所述目标输入特征。3.根据权利要求2所述的方法,其中,所述根据预定的特征种群信息,构建特征种群之前,所述方法还包括:对所述多个待处理特征进行特征组合,形成M个特征组;其中,所述M个特征组中的每个特征组包括至少一个待处理特征,所述M个特征组中的任意两个特征组中的特征不完全相同;M为大于或等于2的正整数;对所述M个特征组中每个特征组进行编码,得到每个特征组的数据序列;根据所述M个特征组中的每个特征组及其数据序列,建立特征组与数据序列之间的所述对应关系。4.根据权利要求3所述的方法,其中,所述对所述M个特征组中每个特征组进行编码,得到每个特征组的数据序列,包括:针对所述M个特征组中每个特征组均执行如下步骤:判断所述多个待处理特征中的每个待处理特征是否在特征组中,得到每个待处理特征的判断结果;根据所述判断结果为每个待处理特征配置标识;其中,在所述判断结果为是的情况下,为待处理特征配置第一标识,在所述判断结果为否的情况下,为待处理特征配置第二标识;按照所述多个待处理特征的预定顺序,将所述多个待处理特征的各个待处理特征的标识进行组合,形成一个特征组对应的一个数据序列。5.根据权利要求2所述的方法,其中,所述在最近一次更新的所述特征种群中获取目标数据序列,包括:在最近一次更新的所述特征种群中的数据序列数量为一个的情况下,将最近一次更新的所述特征种群中的数据序列作为所述目标数据序列;或者,在最近一次更新的所述特征种群中的数据序列数量为多个的情况下,将最近一次更新的所述特征种群中的适应度最大的数据序列作为所述目标数据序列。2CN111538767A权利要求书2/2页6.根据权利要求1所述的方法,其中,所述特征种群中的每个数据序列均为N位的二进制数值,N为大于或等于2的整数。7.根据权利要求1所述的方法,所述损失函数是与所述数据挖掘模型相关的函数。8.根据权利要求7所述的方法,其中,所述损失函数是根据第一函数、第二函数和第三函数中的至少一个函数得到;其中,所述第一函数用于计算所述数据挖掘模型的目标性能指标;所述第二函数用于计算利用所述数据挖掘模型对特征组中的特征对应的数据进行处理所需要的资源量;所述第三函数用于计算存储特征组中的特征对应的数据所占用的存储量。9.根据权利要求8所述的方法,其中,所述损