预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111105303A(43)申请公布日2020.05.05(21)申请号201911101580.2(22)申请日2019.11.12(71)申请人同济大学地址200092上海市杨浦区四平路1239号(72)发明人王成朱航宇胡瑞鑫(74)专利代理机构上海科律专利代理事务所(特殊普通合伙)31290代理人叶凤(51)Int.Cl.G06Q40/02(2012.01)G06Q50/26(2012.01)G06K9/62(2006.01)权利要求书3页说明书9页附图3页(54)发明名称基于增量式网络表征学习的网络借贷欺诈检测方法(57)摘要一种基于增量式网络表征学习的网络借贷欺诈检测方法。本发明原理:用表征能力强大的异质信息网络的形式来分析现实世界借贷数据,将借贷数据以异质信息网络的形式建立一个关系借贷网络。从多类型异质的关系借贷网络中抽取特定关系,形成仅保留一种节点类型的同质借贷网络。针对每一批到达的借贷数据,依次更新关系借贷网络和同质借贷网络,并运用增量式的网络表征学习算法及时更新同质借贷网络中节点的向量表征,以期能够捕获数据之间的最新关联性。基于学习到的向量表征构造和与时序有关的新特征(如:单号与前n个发生的单号的关系),结合分类器实现对借贷数据欺诈检测的二分类模型,进而实现对欺诈的检测与识别。CN111105303ACN111105303A权利要求书1/3页1.一种基于增量式网络表征学习的网络借贷欺诈检测方法,其特征在于,过程为:步骤1,建立关系借贷网络并完成同质化收集历史网络借贷产生的丰富借贷数据,建立异质的关系借贷网络,以此再以单号为节点,以不同借贷数据中同时拥有的属性关系为边,衍生出同质借贷网络;提供给步骤2;步骤2,构建训练样本集汇集原始静态数据,建立初始静态数据集,利用网络表征学习算法变换网络结构,进行向量化,得到基于初始网络借贷数据集的节点对应的向量表征,由这些学习到的向量数据构成训练样本集;提供给步骤3;步骤3,特征构造对训练样本集中的向量数据进行特征构造,为输入欺诈检测模型做准备;提供给步骤4;步骤4,训练欺诈检测模型采用python中机器学习集成库scikit-learn中的XGBoost分类器为本发明的欺诈检测模型,对步骤3构造出的特征输入该分类器进行欺诈检测模型训练;提供给步骤7;步骤5,更新关系借贷网络和同质借贷网络更新收集网络借贷目前产生的借贷数据,针对以时间序列依次到来的增量流式借贷数据,更新关系借贷网络和同质借贷网络,提供给步骤6;步骤6:更新当前测试数据集利用步骤2构建的训练样本集,将以时间序列依次到来的流式借贷数据构建当前的测试数据集,即:将新到来k笔借贷数据加入,并删除初始数据集中时间最早的k笔借贷数据,以实时更新当前测试数据集;参照步骤2,利用网络表征学习算法变换网络结构,进行向量化,得到当前测试数据集的节点对应的向量表征,更新学习到的向量数据更新了当前测试数据集;提供给步骤7;步骤7,特征构造参照步骤3,对测试数据集中的向量数据进行特征构造,为输入欺诈检测模型做准备;提供给步骤8;步骤8,欺诈检测模型进行测试将步骤7当前测试数据集输入步骤4欺诈检测模型,获得到欺诈检测模型的判断结果。2.如权利要求1所述的方法,其特征在于,包括如下步骤步骤1.1:从原始借贷数据中筛选出原始字段(如表1所示),进行字段类型转换和空值去除填充预处理操作;将原始借贷数据划分为单号(APPLYNO)与属性(ATTRIBUTE)两种类型,所述属性(ATTRIBUTE)为借贷数据中除去单号(APPLYNO)以外的其他数据;针对一笔借贷数据,将其记为(bi,ATT(bi)),bi是借贷数据b的单号,ATT(bi)是借贷数据b对应的属性集合,attk(bi)是ATT(bi)中第k个元素;基于原始借贷数据建立关系借贷网络Nr=(V,E),V是节点集,E是边集,其中边e=(u,v),u与v属于节点集V(包含多种类型节点);针对借贷数据b中的每一笔数据bi,首先bi加入节点集V,将ATT(bi)中每一个元素依次加入节点集V,最后将边(bi,attk(bi))加入边集E,attk(bi)是ATT(bi)中第k个元素;执行步骤1.2;2CN111105303A权利要求书2/3页hhhh步骤1.2:基于关系借贷网络建立同质借贷网络Nh=(V,E),V是节点集,E是边集,其h中边e=(u,v,w),u与v属于节点集V(仅包含类型为借贷单号的节点)。当attk(bi)=attkh(bj)时,关系借贷网络中一对边(bi,attk(bi))和(bj,attk(bj))被视为边集E中的边(bi,bj),w为边(bi,bj)出现的次数,作为同质借贷网络Nh中的权重;