预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112559853A(43)申请公布日2021.03.26(21)申请号201910917704.8(22)申请日2019.09.26(71)申请人北京沃东天骏信息技术有限公司地址100176北京市北京经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人李慧(74)专利代理机构中原信达知识产权代理有限责任公司11219代理人冯培培耿雪利(51)Int.Cl.G06F16/9535(2019.01)G06F16/28(2019.01)G06F40/289(2020.01)G06F40/30(2020.01)权利要求书2页说明书12页附图5页(54)发明名称用户标签的生成方法和装置(57)摘要本发明公开了用户标签的生成方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:对用户信息进行分词,得到所述用户的词集;根据所述用户的词集,得到多个主题以及每个主题的关键词;对于每个主题,根据对所述主题的关键词所属目标的操作信息计算所述主题的权重;根据每个主题的权重从多个主题中选择出目标主题,将所述目标主题作为所述用户的标签。该实施方式提高用户标签的生成效率,提升用户标签的生成方法的复用性。CN112559853ACN112559853A权利要求书1/2页1.一种用户标签的生成方法,其特征在于,包括:对用户信息进行分词,得到所述用户的词集;根据所述用户的词集,得到多个主题以及每个主题的关键词;对于每个主题,根据对所述主题的关键词所属目标的操作信息计算所述主题的权重;根据每个主题的权重从多个主题中选择出目标主题,将所述目标主题作为所述用户的标签。2.根据权利要求1所述的方法,其特征在于,所述操作信息包括操作时间、操作次数和操作属性值;根据对所述主题的关键词所属目标的操作信息计算所述主题的权重,包括:针对每种操作,将对所述主题的每个关键词所属目标的操作时间之和与操作时间的时间衰减权重相乘,并将对所述主题的每个关键词所属目标的操作次数之和与操作次数的时间衰减权重相乘,以及将对所述主题的每个关键词所属目标的操作属性值之和与操作属性值的时间衰减权重相乘,将得到的乘积的和作为所述操作的权重;将各操作的权重相加,得到的值作为所述主题的权重。3.根据权利要求2所述的方法,其特征在于,操作时间的时间衰减权重的计算方法包括:对于所述主题的每个关键词,将对所述主题的所述关键词所属目标的操作时间与当前时间的差值的绝对值,与预设的时间衰减因子相乘,得到乘积,将乘积加1作为所述主题的所述关键词的权重;将对所述主题的每个关键词所属目标的操作时间之和,分别与所述主题的每个关键词的权重相除,得到多个商;对所有商进行求和处理,得到总和;对总和进行取对数处理,得到的值作为操作时间的时间衰减权重。4.根据权利要求1所述的方法,其特征在于,根据所述用户的词集,得到多个主题以及每个主题的关键词,包括:从所述用户的词集抽取多个主题,并得到每个主题的第一关键词;对于每个主题,根据所述主题、所述主题的第一关键词和预设词库得到所述主题的第二关键词,所述主题的关键词包括所述主题的第一关键词和所述主题的第二关键词。5.根据权利要求4所述的方法,其特征在于,根据所述主题、所述主题的第一关键词和预设词库得到所述主题的第二关键词,包括:根据所述主题和所述主题的第一关键词生成至少一个目标向量,采用至少一个所述目标向量计算目标向量间的平均距离;对于预设词库中的每个词,生成所述词的向量,若所述词的向量与任何一个所述目标向量的距离大于所述平均距离,则所述主题的第二关键词包括所述词。6.根据权利要求1所述的方法,其特征在于,根据每个主题的权重从多个主题中选择出目标主题,包括:按照主题的权重从大到小的顺序对所有主题的权重进行排列,将排在前三位的主题选择为目标主题。7.根据权利要求1所述的方法,其特征在于,用户信息,包括:用户的历史行为信息、与所述用户关联的物品的信息、所述物品的归属者的信息。2CN112559853A权利要求书2/2页8.一种用户标签的生成装置,其特征在于,包括:分词单元,用于对用户信息进行分词,得到所述用户的词集;处理单元,用于根据所述用户的词集,得到多个主题以及每个主题的关键词;计算单元,用于对于每个主题,根据对所述主题的关键词所属目标的操作信息计算所述主题的权重;选择单元,用于根据每个主题的权重从多个主题中选择出目标主题,将所述目标主题作为所述用户的标签。9.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。10.一种计算机可