预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113887669A(43)申请公布日2022.01.04(21)申请号202111290189.9(22)申请日2021.11.02(71)申请人中国电信股份有限公司地址100033北京市西城区金融大街31号(72)发明人李翔贾炎齐洁于福超(74)专利代理机构北京律智知识产权代理有限公司11438代理人王辉阚梓瑄(51)Int.Cl.G06K9/62(2006.01)G06Q30/02(2012.01)权利要求书2页说明书13页附图5页(54)发明名称用户分类方法、用户分类装置、存储介质与电子设备(57)摘要本公开提供了一种用户分类方法、用户分类装置、计算机可读存储介质与电子设备,属于数据处理技术领域。所述方法包括:获取多个用户的用户数据,所述用户数据包括多个特征变量的特征数据和各所述用户的初始类别标签;按照所述初始类别标签将所述用户数据划分为多个包括正例数据和负例数据的数据组合;对每个数据组合中的正例数据和负例数据进行处理,确定各所述特征变量的特征评分;根据各所述特征变量的特征评分,筛选出所述多个特征变量中的目标特征变量,并通过所述目标特征变量对应的特征数据将所述多个用户划分为多个类别。本公开可以提高用户分类的准确率和效率。CN113887669ACN113887669A权利要求书1/2页1.一种用户分类方法,其特征在于,所述方法包括:获取多个用户的用户数据,所述用户数据包括多个特征变量的特征数据和各所述用户的初始类别标签;按照所述初始类别标签将所述用户数据划分为多个包括正例数据和负例数据的数据组合;对每个数据组合中的正例数据和负例数据进行处理,确定各所述特征变量的特征评分;根据各所述特征变量的特征评分,筛选出所述多个特征变量中的目标特征变量,并通过所述目标特征变量对应的特征数据将所述多个用户划分为多个类别。2.根据权利要求1所述的方法,其特征在于,所述按照所述初始类别标签将所述用户数据划分为多个包括正例数据和负例数据的数据组合,包括:以所述初始类别标签中的至少一个类别标签对应的用户数据为正例数据,以除所述至少一个类别标签外的其他类别标签对应的用户数据为负例数据,将所述用户数据转换为多个包括正例数据和负例数据的第一数据组合;以及以所述初始类别标签中的任意一个类别标签对应的用户数据为正例数据,以除所述任意一个类别标签外的其他任意一个类别标签对应的用户数据为负例数据,将所述用户数据转换为多个包括正例数据和负例数据的第二数据组合。3.根据权利要求2所述的方法,其特征在于,所述特征评分包括各所述特征变量的信息量,所述对每个数据组合中的正例数据和负例数据进行处理,确定各所述特征变量的特征评分,包括:对于所述第一数据组合和所述第二数据组合中的各个数据组合,根据每个数据组合中的正例样本数量和负例样本数量,确定各所述特征变量在各个数据组合中的信息量;按照各所述数据组合的组合类别,对各所述特征变量在各个数据组合中的信息量进行求和,得到所述第一数据组合对应的第一特征信息量和所述第二数据组合对应的第二特征信息量;根据所述第一特征信息量和所述第二特征信息量确定各所述特征变量的信息量。4.根据权利要求3所述的方法,其特征在于,所述根据所述每个数据组合中的正例样本数量和负例样本数量,确定各所述特征变量在各个数据组合中的信息量,包括:对各所述特征变量进行分箱,并计算各所述特征变量对应的每箱变量的证据权重;在所述每个数据组合中,分别计算各所述特征变量对应的每箱变量的正例样本率和负例样本率;基于各所述特征变量对应的每箱变量的证据权重,对各所述特征变量对应的每箱变量的正例样本率和负例样本率的差值进行加权求和,得到各所述特征变量在所述每个数据组合中的信息量。5.根据权利要求3所述的方法,其特征在于,所述根据所述第一特征信息量和所述第二特征信息量确定各所述特征变量的信息量,包括:根据所述第一特征信息量和所述第二特征信息量计算各所述特征变量关于每个初始类别标签的信息量;对各所述特征变量关于每个初始类别标签的信息量进行求和,得到各所述特征变量的2CN113887669A权利要求书2/2页信息量。6.根据权利要求1所述的方法,其特征在于,所述根据各所述特征变量的特征评分,筛选出所述多个特征变量中的目标特征变量,并通过所述目标特征变量对应的特征数据将所述多个用户划分为多个类别,包括:在各所述特征变量的特征评分中,将特征评分大于特征评分阈值的特征变量确定为目标特征变量;提取所述目标特征变量对应的特征数据,得到目标特征数据,并通过预先训练的分类模型对所述目标特征数据进行分类处理,以将所述多个用户划分为多个类别。7.根据权利要求6所述的方法,其特征在于,所述通过预先训练的分类模型对所述目标特征数据进