预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112699672A(43)申请公布日2021.04.23(21)申请号201911013314.4(22)申请日2019.10.23(71)申请人北京沃东天骏信息技术有限公司地址100176北京市北京经济技术开发区科创十一街18号院2号楼4层A402室(72)发明人岳俊杰(74)专利代理机构中原信达知识产权代理有限责任公司11219代理人冯培培耿雪利(51)Int.Cl.G06F40/279(2020.01)G06F16/332(2019.01)G06F16/33(2019.01)权利要求书2页说明书15页附图5页(54)发明名称选择物品的方法和装置(57)摘要本发明公开了选择物品的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:根据第一文本得到第一属性名集合和第一属性名集合的属性值,根据第二文本得到第二属性名集合和第二属性名集合的属性值;根据第一属性名集合、第一属性名集合的属性值、第二属性名集合和第二属性名集合的属性值,确定第一文本描述的物品和第二文本描述的物品的相似度;若相似度大于第一预设值,则根据用户关注属性,从所述第一文本描述的物品和所述第二文本描述的物品中,选择目标物品。该实施方式提高了用户体验度。CN112699672ACN112699672A权利要求书1/2页1.一种选择物品的方法,其特征在于,包括:根据第一文本得到第一属性名集合和所述第一属性名集合的属性值,根据第二文本得到第二属性名集合和所述第二属性名集合的属性值;根据所述第一属性名集合、所述第一属性名集合的属性值、所述第二属性名集合和所述第二属性名集合的属性值,确定所述第一文本描述的物品和所述第二文本描述的物品的相似度;若所述相似度大于第一预设值,则根据用户关注属性,从所述第一文本描述的物品和所述第二文本描述的物品中,选择目标物品。2.根据权利要求1所述的方法,其特征在于,所述第一文本所属类目与所述第二文本所属类目相同;在根据第一文本得到第一属性名集合和所述第一属性名集合的属性值之前,包括:创建所述类目的物品属性库;根据第一文本得到第一属性名集合和所述第一属性名集合的属性值,根据第二文本得到第二属性名集合和所述第二属性名集合的属性值,包括:采用所述类目的物品属性库,根据第一文本得到第一属性名集合和所述第一属性名集合的属性值,根据第二文本得到第二属性名集合和所述第二属性名集合的属性值。3.根据权利要求2所述的方法,其特征在于,创建所述类目的物品属性库,包括:获取所述类目的目标属性名集合,并对所述目标属性名集合进行归一化处理,得到关键属性名集合;根据所述关键属性名集合获取所述关键属性名集合的属性值;根据所述关键属性名集合和所述关键属性名集合的属性值,得到所述类目的物品属性库。4.根据权利要求3所述的方法,其特征在于,采用所述类目的物品属性库,根据第一文本得到第一属性名集合和所述第一属性名集合的属性值,包括:根据第一文本从所述关键属性名集合中选择出第一属性名集合;按照所述第一属性名集合和所述关键属性名集合的属性值从所述第一文本中获取所述第一属性名集合的待定属性值;对所述第一属性名集合的待定属性值进行停用词去除、表示方式统一和属性值拆分处理,得到所述第一属性名集合的属性值。5.根据权利要求3所述的方法,其特征在于,获取所述类目的目标属性名集合,包括:获取所述类目的多个属性名;对于每个属性名,确定与所述属性名对应的属性在所述类目下所有文本的标题中出现的次数;根据与出现的次数大于第二预设值的属性对应的属性名,得到所述类目的目标属性名集合。6.根据权利要求2所述的方法,其特征在于,根据所述第一属性名集合、所述第一属性名集合的属性值、所述第二属性名集合和所述第二属性名集合的属性值,确定所述第一文本描述的物品和所述第二文本描述的物品的相似度,包括:确定所述第一属性名集合和所述第二属性名集合的交集,所述交集包括至少一个相同2CN112699672A权利要求书2/2页属性名;对于每个相同属性名,分别从所述第一属性名集合的属性值中和所述第二属性名集合的属性值中获取所述相同属性名的属性值,对获取的属性值进行相似度计算,得到所述相同属性名的相似度;对得到的相似度进行融合,融合结果作为所述第一文本描述的物品和所述第二文本描述的物品的相似度。7.根据权利要求6所述的方法,其特征在于,对获取的属性值进行相似度计算,得到所述相同属性名的相似度,包括:获取所述类目的多个正例;其中,正例包括多个物品,每个物品的属性值相同;对正例包括的物品进行重组,得到多个负例,从多个负例中,删除物品属性值存在互斥关系的负例,得到所述类目的多个负例;采用所述类目的多个正例和所述类目的多个负例,对编辑距离算法进行训练,得到所述