预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110309840A(43)申请公布日2019.10.08(21)申请号201810258226.X(22)申请日2018.03.27(71)申请人阿里巴巴集团控股有限公司地址英属开曼群岛大开曼资本大厦一座四层847号邮箱(72)发明人郑文豪张雅淋李龙飞(74)专利代理机构北京众达德权知识产权代理有限公司11570代理人刘杰(51)Int.Cl.G06K9/62(2006.01)G06Q20/40(2012.01)权利要求书3页说明书9页附图5页(54)发明名称风险交易识别方法、装置、服务器及存储介质(57)摘要本说明书实施例提供了一种风险交易识别方法,通过对交易数据的特征进行降维处理,针对降维后的特征,利用深度森林网络中每级决策树森林集的多个基分类器进行决策分类,最终确定出是否为风险交易的概率。本发明实施例通过对特征降维处理,可以防止过拟合或达到尽可能保留特征属性的效果。CN110309840ACN110309840A权利要求书1/3页1.一种风险交易识别方法,包括:对待识别交易数据进行特征提取,得到用户类别特征及交易类别特征;由所述用户类别特征及交易类别特征组合得到第一维度特征,并对所述第一维度特征进行降维处理,得到第二维度特征;将所述第二维度特征输入至预先训练的深度森林网络,其中,所述深度森林网络包括多级决策树森林集,每一级决策树森林集中包括多个基分类器;基于所述深度森林网络,对多维度特征进行决策分类,得到待识别交易数据为风险交易的概率。2.根据权利要求1所述的方法,还包括:基于交易样本训练出所述深度森林网络;所述基于交易样本训练出所述深度森林网络包括:收集有关风险交易的黑白样本,并对黑白样本数据进行特征提取得到第一维度特征,以及对第一维度特征进行降维处理,得到第二维度特征;根据第二维度特征训练第一级决策树森林集的各个基分类器,并将前一级决策树森林集的输出特征与第二维度特征进行拼接,利用拼接特征训练下一级决策树森林集的各个基分类器;其中在每一级决策树森林集训练完成后判断是否达到预定结束条件,如果未达到才进行下一级决策树森林集的训练;当达到预定结束条件时,结束训练,训练得到由多级决策树森林集构成的所述深度森林网络。3.根据权利要求1或2所述的方法,所述对所述第一维度特征进行降维处理,得到第二维度特征包括:根据特征类别,确定特征采样频率;按照特征采样频率对所述初步维度特征进行采样,得到所述第二维度特征。4.根据权利要求2所述的方法,所述基分类器包括一个或多个决策树;所述方法还包括:根据黑白样本的比例,确定出决策树深度最大阈值;设置所述基分类器中决策树的深度不超过所述深度最大阈值。5.根据权利要求2所述的方法,还包括:将黑白样本的数据划分为预置数目的分组;任选一个分组作为验证集,其余分组的数据集合作为训练集;所述每级决策树森林集的训练过程中,是利用每个训练集分别训练每级决策树森林集中的各个基分类器的。6.根据权利要求5所述的方法,还包括:按照黑白样本比例,确定黑样本和白样本各自的样本采样频率;按照黑白样各自的样本采样频率,分别对黑白样本进行采样,从而确保所述每个分组中黑白样本的数目相等或近似相等。7.一种用于风险交易识别的深度森林网络的训练方法,包括:收集有关风险交易的黑白样本,并对黑白样本数据进行特征提取得到得到用户类别特征及交易类别特征;由用户类别特征及交易类别特征构建得到第一维度特征,以及对第一维度特征进行降维处理,得到第二维度特征;2CN110309840A权利要求书2/3页根据第二维度特征训练第一级决策树森林集的各个基分类器,并将前一级决策树森林集的输出特征与第二维度特征进行拼接,利用拼接特征训练下一级决策树森林集的各个基分类器;其中在每一级决策树森林集训练完成后判断是否达到预定结束条件,如果未达到才进行下一级决策树森林集的训练;当达到预定结束条件时,结束训练,训练得到由多级决策树森林集构成的所述深度森林网络。8.一种风险交易识别装置,包括:特征提取及处理单元,用于对待识别交易数据进行特征提取得到得到用户类别特征及交易类别特征;由用户类别特征及交易类别特征构建第一维度特征,并对所述第一维度特征进行降维处理,得到第二维度特征;预测单元,将所述第二维度特征输入至预先训练的深度森林网络,其中,所述深度森林网络包括多级决策树森林集,每一级决策树森林集中包括多个基分类器;基于所述深度森林网络,对多维度特征进行决策分类,得到待识别交易数据是否为风险交易的概率。9.根据权利要求8所述的装置,还包括:网络训练单元;所述网络训练单元包括:样本获取子单元,用于收集有关风险交易的黑白样本;特征提取及处理子单元,用于对黑白样本数据进行特征提取得到第一维度特征,以及