预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109903053A(43)申请公布日2019.06.18(21)申请号201910154805.4(22)申请日2019.03.01(71)申请人成都新希望金融信息有限公司地址610000四川省成都市高新区仁和街39号6栋2层3号(72)发明人冯诗炀程序段银春(74)专利代理机构成都智言知识产权代理有限公司51282代理人徐金琼(51)Int.Cl.G06Q20/40(2012.01)G06Q40/02(2012.01)权利要求书3页说明书12页附图4页(54)发明名称一种基于传感器数据进行行为识别的反欺诈方法(57)摘要本发明涉及行为识别技术领域,提供了一种基于传感器数据进行行为识别的反欺诈方法,主要技术方案包括首先对原始数据采用标准化数据预处理方案进行处理,并使用标准化线下模型对数据进行分类,得到初步分类结果及分类置信度。对初步分类结果总识别置信度较高的样本标签进行保留,对识别置信度较低的数据样本按照时间戳,将其映射回原始数据之后用其分类标签所对应的非标准化数据预处理方案重新进行数据预处理,对得到的数据使用对应的非标准化线下模型再次进行识别,对于分类置信度低于预设阈值的样本,标注为未知行为,对置信度高于阈值的样本标签进行保留。对上述两次识别之后得到的行为序列输入线上模型进行动态时序特征的捕捉,得出分类结果。CN109903053ACN109903053A权利要求书1/3页1.一种基于传感器数据进行行为识别的反欺诈方法,其特征在于,包括以下步骤:步骤1、线下数据采集,并按照行为定义进行人工标注行为标签;步骤2、对采集到的样本根据行为标签分别按照标准化和非标准化的预处理方案进行数据预处理;步骤3、对预处理后的多个数据样本分别进行分析和建模,得到一套标准化线下判别模型和与行为标签所对应的多套非标准化线下判别模型;步骤4、线上环境中,首先对原始数据采用标准化数据预处理方案进行处理,并使用用线下训练好的标准化线下模型对数据进行分类,得到初步分类的置信度;步骤5、对初步分类的置信度较高的样本行为标签进行保留,对识别置信度较低的数据样本重新进行数据预处理,然后使用对应的非标准化线下模型再次进行识别,对于分类置信度低于预设阈值的样本,标注为未知行为,对置信度高于阈值的样本标签进行保留,得到行为序列;步骤6、对于步骤5得到的行为序列,结合页面埋点数据通过落地为规则来进行反欺诈。2.根据权利要求1所述的一种基于传感器数据进行行为识别的反欺诈方法,其特征在于,每套非标准化线下判别模型和非标准化数据预处理方案均对每一种行为标签保持一一对应关系。3.根据权利要求1所述的一种基于传感器数据进行行为识别的反欺诈方法,其特征在于,步骤1包括以下步骤:步骤1.1、根据具体应用场景,定义已知行为类别;步骤1.2、根据行为定义,对每种行为进行模拟实验,预设传感器采样频率;步骤1.3、使用智能移动终端采集三轴加速度传感器数据和三轴陀螺仪传感器数据;步骤1.4、对采集到的数据进行去头尾的数据清洗;步骤1.5、对采集到的数据按照行为定义进行人工标注行为标签。4.根据权利要求1所述的一种基于传感器数据进行行为识别的反欺诈方法,其特征在于,步骤2包括以下步骤:步骤2.1、对采集到的传感器数据首先会对原始数据进行降噪,从原始传感器数据中的每一维度数据中剥离出趋势项和波动项;步骤2.2、对降噪后的数据进行滑动区间处理;步骤2.3、对于滑动区间处理完之后的数据进行特征工程,特征工程会对落于一个滑动区间的数据进行运算和整合,经过处理后,每一行数据代表一个滑动区间样本;步骤2.4、选择一个标准的滑动区间长度及重合率配置方案,并用应用于线上环境中,对所有实时数据用该标准化预处理方案进行第一次预处理,另外,基于每一个定义的已知行为类别的最优滑动区间长度及重合率设置,对线下采集到的数据集进行多次数据预处理,得到多个训练集。5.根据权利要求4所述的一种基于传感器数据进行行为识别的反欺诈方法,其特征在于,步骤3包括以下步骤:步骤3.1、模型会对经过步骤2加工后的多个训练集分别进行分析和建模;步骤3.2、模型训练的过程首先对每一个样本依据其是否为当前识别的目标行为类别,标注为正反例,采用标记集合yN={+1,-1}来进行标记;2CN109903053A权利要求书2/3页步骤33、对每一个特征通过遍历其取值区间和不等式关系来构建多个弱分类器,并进行多次迭代,每次迭代根据分类错误率选出一个最优的弱分类器;步骤3.4、在开始迭代之前,对所有样本赋予初始权重,在接下来的每次迭代过程中,通过有区别的调整分类正确和分类错误的样本的权重来对弱分类器使用加权分类误差进行排序,并选择当前迭代中加权误差最小的弱分类器为最优弱分类器,