预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115577257A(43)申请公布日2023.01.06(21)申请号202211013255.2(22)申请日2022.08.23(71)申请人支付宝(杭州)信息技术有限公司地址310023浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人林金镇应缜哲王维强(74)专利代理机构上海专利商标事务所有限公司31100专利代理师钱孟清(51)Int.Cl.G06F18/214(2023.01)G06F18/2431(2023.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书7页附图5页(54)发明名称用于确定数值型表格数据的类别的方法和系统(57)摘要本公开涉及一种用于确定数值型表格数据的类别的方法和系统。该系统可包括:数据预处理模块,所述数据预处理模块被配置成对所述数值型表格数据进行离散化分箱以将其转换成经离散的特征向量;以及对所述数值型表格数据进行分位点数据分布转换,以将其转换成所需数据分布;神经网络,所述神经网络包括用于对经分箱处理所得到的特征向量进行嵌入处理的嵌入层;用于对经分位点数据分布转换处理的数值型表格数据进行处理的第一DNN层;乘法器,所述乘法器将嵌入层和第一DNN层的输出相乘;以及第二DNN层,所述第二DNN层使用乘法器的输出作为输入;以及输出模块,所述输出模块被配置成使用Sigmod激活函数对第二DNN层的输出进行处理以获得数值型表格数据的类别。CN115577257ACN115577257A权利要求书1/2页1.一种用于确定数值型表格数据的类别的系统,所述系统包括:数据预处理模块,所述数据预处理模块被配置成:对所述数值型表格数据进行离散化分箱以将其转换成经离散的特征向量;以及对所述数值型表格数据进行分位点数据分布转换,以将其转换成所需数据分布;神经网络,所述神经网络包括:嵌入层,用于对经分箱处理所得到的特征向量进行嵌入处理以得到第一输出向量;第一DNN层,用于对经分位点数据分布转换处理的所述数值型表格数据进行处理以得到第二输出向量;乘法器,所述乘法器将所述第一输出向量和所述第二输出向量逐元素相乘以得到第三输出向量;以及第二DNN层,所述第二DNN层使用所述第三输出向量作为输入来得到第四输出向量;以及输出模块,所述输出模块被配置成使用Sigmod激活函数对所述第四输出向量进行处理以获得所述数值型表格数据的类别。2.根据权利要求1所述的系统,其中所述神经网络还包括双曲正切函数,并且其中所述双曲正切函数使用所述第二输出向量作为自变量来得到第五输出向量,且所述乘法器将所述第一输出向量和所述第五输出向量逐元素相乘以得到所述第三输出向量。3.根据权利要求1所述的系统,其中所需数据分布是正态分布、均匀分布中的一者。4.根据权利要求1所述的系统,其中所述数值型表格数据是金融交易数据,并且所述系统被应用来预测所述数值型表格数据是否是金融欺诈。5.根据权利要求1所述的系统,其中所述数值型表格数据包括N列M行数据,其中N是所述数值型表格数据的特征的数目,M是所述数值型表格数据的每一特征的取值数目,其中N和M都是大于等于1的整数。6.一种用于确定数值型表格数据的类别的方法,所述方法包括:对所述数值型表格数据进行预处理,所述预处理包括:对所述数值型表格数据进行离散化分箱以将其转换成经离散的特征向量;以及对所述数值型表格数据进行分位点数据分布转换,以将其转换成所需数据分布;经由神经网络对经预处理的所述数值型表格数据进行处理,其中所述神经网络:对经分箱处理所得到的特征向量进行嵌入处理以得到第一输出向量;通过第一DNN对经分位点数据分布转换处理的所述数值型表格数据进行处理以得到第二输出向量;将所述第一输出向量和所述第二输出向量逐元素相乘以得到第三输出向量;以及通过第二DNN对所述第三输出向量进行处理以得到第四输出向量;以及使用Sigmod激活函数对所述第四输出向量进行处理以获得所述数值型表格数据的类别。7.根据权利要求6所述的方法,其中所述神经网络还:使用所述第二输出向量作为双曲正切函数的自变量来得到第五输出向量,以及代替使用所述第二输出向量,将所述第一输出向量和所述第五输出向量逐元素相乘以得到所述第三输出向量。2CN115577257A权利要求书2/2页8.根据权利要求6所述的方法,其中所需数据分布是正态分布、均匀分布中的一者。9.根据权利要求6所述的方法,其中所述数值型表格数据是金融交易数据,并且所述方法被应用来预测所述数值型表格数据是否是金融欺诈。10.根据权利要求6所述的方法,其中所述数值型表格数据包括N列M行数据,其中N是所述数值型表格数据的特征的数目,M是所述数值型表格数据的每一特征的取值数目,其中N和