预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共44页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113763024A(43)申请公布日2021.12.07(21)申请号202110297356.6G06F40/284(2020.01)(22)申请日2021.03.19(71)申请人北京沃东天骏信息技术有限公司地址100176北京市大兴区经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人朱禹邓旺文刘苗苗(74)专利代理机构北京派特恩知识产权代理有限公司11270代理人周丽莎张颖玲(51)Int.Cl.G06Q30/02(2012.01)G06Q30/06(2012.01)G06F16/35(2019.01)G06F40/216(2020.01)权利要求书4页说明书22页附图17页(54)发明名称物品属性挖掘方法、装置及存储介质(57)摘要本发明提供了一种物品属性挖掘方法、装置及存储介质,通过在多个平台中获取多个物品对应的多源数据,对多源数据进行结构化筛选处理,得到结构化信息;基于结构化信息中的识别信息,确定出属于多个实体的多个同类物品,并将多个同类物品分别对应的结构化信息中的评价信息融合得到聚合评价数据;基于聚合评价数据中的每个评价信息的多个评价关键词对中的词性,提取出表征每个同类物品负面属性的负属性数据对,从而得到多个同类物品对应的属性数据库;基于目标物品信息,从属性数据库中查找到目标负属性数据对,并发送给客户端进行展示。本发明可以在提高物品缺陷的挖掘效率的同时挖掘出更加全面的缺陷数据。CN113763024ACN113763024A权利要求书1/4页1.一种物品属性挖掘方法,其特征在于,包括:在多个平台中获取多个物品对应的多源数据,对所述多源数据进行结构化筛选处理,得到所述多个物品中的多个中间物品分别对应的结构化信息;所述结构化信息表征对应的中间物品的不同描述内容的信息;基于所述结构化信息中的识别信息,在所述多个中间物品中确定出属于多个实体的多个同类物品,并将所述多个同类物品分别对应的结构化信息中的评价信息融合得到聚合评价数据;基于分析所述聚合评价数据中的每个评价信息确定出的多个评价关键词对中的词性,提取出表征每个同类物品负面属性的负属性数据对,从而得到多个同类物品对应的属性数据库;所述多个评价关键词对为对应多个评价信息中表征用户观点的词语对;基于接收的客户端发送的目标物品信息,从所述属性数据库中查找到与所述目标物品信息对应的一个同类物品对应的目标负属性数据对,并发送给所述客户端进行展示。2.根据权利要求1所述的物品属性挖掘方法,其特征在于,所述基于所述多个结构化信息中的识别信息,在所述多个中间物品中确定出属于多个实体的多个同类物品,并将所述多个同类物品分别对应的结构化信息中的评价信息融合得到聚合评价数据,包括:计算每个结构化信息中的多个识别信息分别与种子物品对应的种子识别信息的相似度;所述种子物品为所述中间物品中属于所述多个实体中的任一个实体中的一个物品;基于所述相似度,在所述多个中间物品中确定出与每个实体对应的所述种子物品属于同一类的至少一个中间物品对应的每个同类物品;将所述每个同类物品对应的至少一个中间物品的结构化信息中的评价信息进行融合,得到由所述每个实体对应的所述每个同类物品组成的所述多个同类物品分别对应的所述聚合评价信息。3.根据权利要求2所述的物品属性挖掘方法,其特征在于,所述计算每个结构化信息中的多个识别信息分别与种子物品对应的种子识别信息的相似度,包括:对所述每个结构化信息中的每个识别信息进行分词处理,得到所述每个识别信息对应的至少一个关键词;对每个种子识别信息进行分词处理,得到所述每个种子识别信息对应的至少一个种子关键词;对所述至少一个关键词和所述至少一个种子关键词分别进行转化,得到对应所述至少一个关键词的词向量和对应所述至少一个种子关键词的词向量;将所述至少一个关键词的所述词向量进行融合,得到所述每个识别信息的第一相似信息,以及将所述至少一个种子关键词的所述词向量进行融合,得到对应的所述每个种子识别信息的第二相似信息;将所述每个识别信息的所述第一相似信息与对应的所述种子识别信息的所述第二相似信息进行相似计算,得到对应所述每个结构化信息中的所述多个识别信息与对应的种子识别信息之间的相似度。4.根据权利要求2或3所述的物品属性挖掘方法,其特征在于,所述基于所述相似度,在所述多个中间物品中确定出与每个实体对应的所述种子物品属于同一类的至少一个中间物品对应的每个同类物品,包括:2CN113763024A权利要求书2/4页确定出所述每个结构化信息中的所述多个识别信息与对应的种子识别信息之间的相似度中,高于相似度阈值的目标相似度;将所述多个中间物品中的与所述目标相似度对应的所述至少一个中