预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共33页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111523649A(43)申请公布日2020.08.11(21)申请号202010384217.2(22)申请日2020.05.09(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人曹绍升崔卿(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人陈霁周良玉(51)Int.Cl.G06N3/04(2006.01)G06N3/08(2006.01)G06N20/00(2019.01)G06Q40/02(2012.01)权利要求书4页说明书21页附图7页(54)发明名称针对业务模型进行数据预处理的方法及装置(57)摘要本发明涉及针对业务模型进行数据预处理的方法及装置。本说明书实施例提供一种新型的用于处理分类业务的业务模型,该业务模型通过多个深度网络实现,在多个深度网络中,通过引入描述不同特征值的特征表达向量,以及与各个分类类别分别对应的各个层标签向量,可以在每一个深度网络中,都充分考虑各个业务特征对于相应分类类别的重要度。在利用业务模型进行目标类别确定时,可以针对每个分类类别确定其作为待处理的业务数据的目标类别的可能性,从而提高业务模型的准确度,并且由于在各个深度网络中确定了相应业务特征的重要度系数,使得业务模型的业务处理结果具有可追溯性,提高使用体验。CN111523649ACN111523649A权利要求书1/4页1.一种针对业务模型进行数据预处理的方法,所述业务模型用于针对给定的业务数据从多个预定类别上确定出目标类别,所述业务模型包括多个深度网络,所述多个深度网络中的第一深度网络包括第一向量分配层和第一向量融合层,以及分别对应于所述多个预定类别的各个层标签向量;用于对所述业务模型进行数据预处理的训练样本包括第一样本,所述第一样本对应有第一样本标签;所述方法包括:基于所述第一样本确定所述第一深度网络对应的多个业务特征上的各个样本特征值;通过所述第一向量分配层,为各个业务特征分别分配用于描述相应样本特征值的各个样本特征表达向量;利用所述第一向量融合层,通过以下方式对各个样本特征表达向量执行向量融合操作:从各个层标签向量中,获取与所述第一样本标签对应的第一层标签向量;基于各个样本特征表达向量分别与所述第一层标签向量的相关性,确定各个业务特征分别对应的各个样本重要度系数;利用各个样本重要度系数融合各个样本特征表达向量,得到所述第一深度网络的样本输出向量;以最大化所述样本输出向量与所述第一深度网络的目标向量的相关度为目标,至少更新各个业务特征各自对应的样本特征表达向量及所述第一层标签向量。2.根据权利要求1所述的方法,其中:在所述第一深度网络是第一个深度网络的情况下,所述多个业务特征上的各个样本特征值从所述第一样本中提取;在所述第一深度网络是第二个或以后的深度网络时,所述多个业务特征上的各个样本特征值通过前一深度网络的样本输出向量确定。3.根据权利要求1所述的方法,其中,所述多个业务特征包括第一特征,所述第一特征对应m1个离散特征值,所述m1个离散特征值分别对应m1个候选向量;所述通过所述第一向量分配层,为各个业务特征分别分配用于描述相应样本特征值的各个样本特征表达向量包括:从所述m1个离散特征值中确定与所述第一特征的样本特征值大小最接近的离散特征值;将所述最接近的离散特征值对应的候选向量,确定为针对所述第一样本,对应所述第一特征的样本特征表达向量。4.根据权利要求1所述的方法,其中,所述多个业务特征包括第二特征,所述第二特征对应m2个数值区间,所述m2个数值区间分别对应m2个候选向量;所述通过所述第一向量分配层,为各个业务特征分别分配用于描述相应样本特征值的各个样本特征表达向量包括:针对所述第一样本在所述第二特征上的样本特征值,检测在所述m2个数值区间中所落入的第一数值区间;将所述第一数值区间对应的候选向量确定为,针对所述第一样本,对应所述第一特征的样本特征表达向量。5.根据权利要求1所述的方法,其中,所述多个业务特征包括第三特征,所述第三特征对应第三样本特征表达向量,所述基于各个样本特征表达向量分别与所述第一层标签向量的相关性,确定各个业务特征分别对应的各个样本重要度系数包括:基于所述第三样本特征表达向量与所述第一层标签向量的相似度,确定所述第三特征2CN111523649A权利要求书2/4页对应的重要度因子,其中,所述第三特征对应的重要度因子和所述第三样本特征表达向量与所述第一层标签向量的相似度正相关;将所述第三重要度因子与所述多个业务特征分别对应的各个重要度因子之和的比值,作为所述第一样本对应所述第三特征的样本重要度系数。6.根据权利要求5所述的方法,其中