预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113609308A(43)申请公布日2021.11.05(21)申请号202110926830.7(22)申请日2021.08.12(71)申请人脸萌有限公司地址英国开曼群岛(72)发明人高远熊泓宇冯一琦刘宾汪罕(74)专利代理机构北京英创嘉友知识产权代理事务所(普通合伙)11447代理人李柯莹(51)Int.Cl.G06F16/36(2019.01)G06F16/35(2019.01)G06F16/33(2019.01)G06F16/903(2019.01)权利要求书2页说明书12页附图3页(54)发明名称知识图谱构建方法、装置、存储介质及电子设备(57)摘要本公开涉及一种知识图谱构建方法、装置、存储介质及电子设备。该方法包括:获取目标实体标识符,并确定所述目标实体标识符对应的行业类型标签;根据所述行业类型标签、行业类型与行业属性表的预设对应关系,确定目标行业属性表;基于所述目标行业属性表中的各个目标属性名称,从公有数据库中获取所述目标实体标识符的各个目标属性值,得到所述目标实体标识符的目标属性,其中,所述目标属性表征由所述目标属性名称和所述目标属性值组成的键值对;根据所述目标实体标识符表征的实体、所述行业类型标签以及所述目标属性构建知识图谱。采用本公开的这种方法,可挖掘多个领域内的不同实体,以构建跨行业知识图谱,从而描述不同行业的实体之间的关系。CN113609308ACN113609308A权利要求书1/2页1.一种知识图谱构建方法,其特征在于,所述方法包括:获取目标实体标识符,并确定所述目标实体标识符对应的行业类型标签;根据所述行业类型标签、行业类型与行业属性表的预设对应关系,确定目标行业属性表;基于所述目标行业属性表中的各个目标属性名称,从公有数据库中获取所述目标实体标识符的各个目标属性值,得到所述目标实体标识符的目标属性,其中,所述目标属性表征由所述目标属性名称和所述目标属性值组成的键值对;根据所述目标实体标识符表征的实体、所述行业类型标签以及所述目标属性构建知识图谱。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标行业属性表中的各个目标属性名称,从公有数据库中获取所述目标实体标识符的各个目标属性值,得到所述目标实体标识符的目标属性,包括:基于所述目标实体标识符构造公有数据库查询链接;根据所述公有数据库查询链接向所述公有数据库发起数据查询请求;获取所述公有数据库返回的用于响应所述数据查询请求的网页源代码;根据正则表达式,从所述网页源代码中匹配得到与所述目标行业属性表中各所述目标属性名称对应的所述目标属性值,得到所述目标实体标识符的所述目标属性。3.根据权利要求2所述的方法,其特征在于,所述公有数据库中存储的字段与字段码一一对应,所述根据正则表达式,从所述网页源代码中匹配得到与所述目标行业属性表中各所述目标属性名称对应的所述目标属性值,得到所述目标实体标识符的所述目标属性,包括:确定所述目标行业属性表中各所述目标属性名称对应的目标字段码;根据所述目标字段码构造所述正则表达式;根据所述正则表达式,从所述网页源代码中提取与所述目标字段码对应的字段,得到所述目标属性值。4.根据权利要求1所述的方法,其特征在于,所述确定所述目标实体标识符对应的行业类型标签,包括:通过搜索引擎搜索所述目标实体标识符,得到与所述目标实体标识符相关的检索信息;从所述检索信息中提取关键词;将所述关键词的特征表示输入行业分类模型,得到所述目标实体标识符的所述行业类型标签。5.根据权利要求4所述的方法,其特征在于,所述通过搜索引擎搜索所述目标实体标识符,得到与所述目标实体标识符相关的检索信息,包括:根据所述目标实体标识符构造维基百科访问链接;获取与所述维基百科访问链接对应的网页,并从所述网页中提取所述检索信息。6.根据权利要求4所述的方法,其特征在于,所述从所述检索信息中提取关键词,包括:从所述检索信息中提取每一herf属性标签下的文本,并去除提取到的各herf属性标签下的文本中的停用词,得到所述关键词。2CN113609308A权利要求书2/2页7.根据权利要求1‑6中任一项所述的方法,其特征在于,所述知识图谱包括由不同的所述行业类型标签标记的实体,所述知识图谱用于在跨行业推荐场景下,向在预设历史时间段内访问第一目标实体的用户推荐与所述第一目标实体具有至少一个相同的所述目标属性、且所述行业类型标签不同的第二目标实体。8.一种知识图谱构建装置,其特征在于,所述装置包括:第一获取模块,用于获取目标实体标识符,并确定所述目标实体标识符对应的行业类型标签;确定模块,用于根据所述行业类型标签、行业类型与行业属性表的预设对应关系,确定目标行业属性表;第二获取模块,用于基于所