预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114692892A(43)申请公布日2022.07.01(21)申请号202210285951.2(22)申请日2022.03.23(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人杨阳傅幸周璟吕乐王宁涛蒋晨之刘芳卿王维强(74)专利代理机构济南信达专利事务所有限公司37100专利代理师李世喆(51)Int.Cl.G06N20/00(2019.01)G06F17/16(2006.01)权利要求书3页说明书12页附图4页(54)发明名称对数值特征进行处理的方法、模型训练方法和装置(57)摘要本说明书实施例描述了对数值特征进行处理的方法、模型训练方法和装置。根据实施例的方法,考虑对数值特征进行二进制编码,然后根据得到的二进制数值特征中的值可以确定出特征矩阵。如此实现了对数值特征可能值都进行了编码,能够降低特征信息损失的可能。进一步,对得到的特征矩阵进行数据域覆盖,能够使得利用该数值特征训练得到的模型在预测应用时,对未参与模型训练的数值输入值也能具有较好的输出。CN114692892ACN114692892A权利要求书1/3页1.对数值特征进行处理的方法,包括:获取用于模型训练的待处理数值特征;对所述待处理数值特征进行二进制编码,得到二进制数值特征;根据所述二进制数值特征中的值,确定特征矩阵;对所述特征矩阵进行数据域覆盖,得到所述待处理数值特征的特征向量;其中,所述数据域为所述模型在应用时输入数值的取值范围。2.根据权利要求1所述的方法,其中,所述对所述待处理数值特征进行二进制编码得到二进制数值特征,包括:对所述待处理数值特征进行归一化处理,得到归一化数值特征;将所述归一化数值特征进行二进制转换,得到所述二进制数值特征。3.根据权利要求2所述的方法,其中,所述对所述待处理数值特征进行归一化处理得到归一化数值特征,包括:将所述待处理数值特征转换为类型为整型的第一数值特征;从至少两个数值范围中确定所述第一数值特征所属的目标数值范围;其中,所述至少两个数值范围为对至少两个特征的数值进行统计得到;根据所述第一数值特征与所述目标数值范围,确定所述归一化数值特征。4.根据权利要求3所述的方法,其中,所述将所述待处理数值特征转换为类型为整型的第一数值特征,包括:当所述待处理数值特征为浮点类型时,将该浮点类型的待处理数值特征乘以预先设定的数据精度截断值;其中,该数据精度截断值不小于所述待处理数值特征的精度值;获取所得到的乘积中的整数部分,得到所述第一数值特征。5.根据权利要求3所述的方法,其中,当所述第一数值特征不在所述至少两个数值范围中的任意一个数值范围内时,所述从至少两个数值范围中确定所述第一数值特征所属的目标数值范围,包括:计算所述第一数值特征与所述至少两个数值范围中的每一个边界值的差值;其中,边界值包括数值范围中的最大值和最小值;确定计算出最小差值时使用的第一边界值;将第一边界值所属的数值范围,确定为所述目标数值范围。6.根据权利要求3所述的方法,其中,所述根据所述第一数值特征与所述目标数值范围确定所述归一化数值特征,包括:当所述第一数值特征在所述目标数值范围内时,将该第一数值特征与该目标数值范围内的最小值的差值确定为所述归一化数值特征;当所述第一数值特征小于所述目标数值范围内的最小值时,将0确定为所述归一化数值特征;当所述第一数值特征大于所述目标数值范围内的最大值时,将所述目标数值范围内的最大值与最小值的差值确定为所述归一化数值特征。7.根据权利要求1所述的方法,其中,所述根据所述二进制数值特征中的值确定特征矩阵,包括:确定所述二进制数值特征的二进制长度n;其中,n为不小于1的正数;2CN114692892A权利要求书2/3页根据所述二进制数值特征中每一位二进制的值,确定n个第一特征向量;其中,每一个第一特征向量对应一位二进制的值;将所述n个第一特征向量拼接为一个n×m的特征矩阵;其中,m为所述第一特征向量的长度。8.根据权利要求1所述的方法,其中,所述对所述特征矩阵进行数据域覆盖得到所述待处理数值特征的特征向量,包括:利用预先设定的卷积核对所述特征矩阵做卷积,得到至少一个第二特征向量;将所述至少一个第二特征向量进行拼接,得到所述特征向量。9.根据权利要求8所述的方法,其中,所述预先设定的卷积核包括至少两个,且该至少两个卷积核所对应的矩阵的列数与所述特征矩阵的列数相同,任意两个卷积核的行数不同。10.根据权利要求8所述的方法,其中,所述将所述至少一个第二特征向量进行拼接得到所述特征向量,包括:确定每一个所述第二特征向量的一个特征表现值;将各个第二特征向量的各个特征表现值组合为一个向量,并将该向量确定