预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN116010688A(43)申请公布日2023.04.25(21)申请号202211597199.1(22)申请日2022.12.12(71)申请人和元达信息科技有限公司地址510000广东省广州市海珠区昌岗东路257号之一1906、1907、1908、1909室(72)发明人王国章黄振琳朱建建韩钟达(74)专利代理机构广州凯东知识产权代理有限公司44259专利代理师曾志环(51)Int.Cl.G06F16/9535(2019.01)G06F16/906(2019.01)G06F18/2431(2023.01)权利要求书2页说明书6页附图1页(54)发明名称一种用户行为标签识别方法、系统、设备及存储介质(57)摘要本发明公开了一种用户行为标签识别方法、系统、设备及存储介质,方法包括获取移动大数据平台的用户各维度数据及互联网数据,对获取的互联网数据进行深度报文检测,得到解析后的互联网数据,对用户各维度数据和解析后的互联网数据进行数据预处理,得到数据集,基于所述数据集构建决策树模型,所述决策树模型的输入为未标注的用户各维度数据及互联网数据,所述决策树模型的输出为用户行为标签,实时采集待识别的未标注的用户各维度数据及互联网数据,将待识别的未标注的用户各维度数据及互联网数据输入至所述决策树模型中进行识别,得到用户标签识别结果,从而实现用户行为标签的识别。CN116010688ACN116010688A权利要求书1/2页1.一种用户行为标签识别方法,其特征在于,所述方法基于决策树模型,具体包括:获取移动大数据平台的用户各维度数据及互联网数据;对获取的互联网数据进行深度报文检测,得到解析后的互联网数据;对用户各维度数据和解析后的互联网数据进行数据预处理,得到数据集;基于所述数据集构建决策树模型,所述决策树模型的输入为未标注的用户各维度数据及互联网数据,所述决策树模型的输出为用户行为标签;实时采集待识别的未标注的用户各维度数据及互联网数据;将待识别的未标注的用户各维度数据及互联网数据输入至所述决策树模型中进行识别,得到用户标签识别结果,从而实现用户行为标签的识别。2.根据权利要求1所述的一种用户行为标签识别方法,其特征在于,所述对获取的互联网数据进行深度报文检测,得到解析后的互联网数据,具体包括:从获取的互联网数据提取目标应用APP的数据,以获取上网行为数据,其中,所述上网行为数据包括上网特征信息和上网特征信息对应的访问类型;对上网特征信息和上网特征信息对应的访问类型进行编码处理,得到解析后的互联网数据。3.根据权利要求2所述的一种用户行为标签识别方法,其特征在于,所述对用户各维度数据和解析后的互联网数据进行数据预处理,得到数据集,具体包括:去掉用户各维度数据和解析后的互联网数据的重复值,得到分类变量和连续变量;根据特征概率分别对所述分类变量和连续变量进行缺失值处理,并分别对缺失值处理后的分类变量和连续变量进行编码转换为输入向量,得到数据集。4.根据权利要求3所述的一种用户行为标签识别方法,其特征在于,所述基于所述数据集构建决策树模型,具体包括:将数据集划分为训练数据集和测试数据集;输入特征向量,并给定阈值,得到初始化模型;基于训练数据集确定所述初始化模型的根节点,并依据所述根节点确定对应的子节点;计算基尼系数;依据所述基尼系数对子节点进行决策,得到叶节点;递归所述叶节点,从而构建出决策树模型。5.根据权利要求4所述的一种用户行为标签识别方法,其特征在于,所述基于所述数据集构建决策树模型还包括:采用后剪枝方法对决策树模型进行优化,并根据损失函数确定是否剪枝,选择交叉验证结果好的子树模型作为最优决策树模型。6.根据权利要求5所述的一种用户行为标签识别方法,其特征在于,所述方法还包括从最优决策树模型选择出所需决策树模型,具体包括:选择评估指标对最优决策树模型进行评估得到准确率符合要求的决策树模型。7.根据权利要求6所述的一种用户行为标签识别方法,其特征在于,所述选择评估指标对最优决策树模型进行评估得到准确率符合要求的决策树模型,具体包括:选择准确率和召回率评估最优决策树模型,得到评估值;2CN116010688A权利要求书2/2页依据评估值选择出准确率符合要求的决策树模型。8.一种用户行为标签识别系统,其特征在于,包括:获取模块,用于获取移动大数据平台的用户各维度数据及互联网数据;深度报文检测模块,用于对获取的互联网数据进行深度报文检测,得到解析后的互联网数据;预处理模块,用于对用户各维度数据和解析后的互联网数据进行数据预处理,得到数据集;构建模块,用于基于所述数据集构建决策树模型;采集模块,用于实时采集待识别的未标注的用户各维度数据及互联网数据;输入模块,用于将待识别的未标注的用