预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110147437A(43)申请公布日2019.08.20(21)申请号201910436619.X(22)申请日2019.05.23(71)申请人北京金山数字娱乐科技有限公司地址100085北京市海淀区小营西路33号金山软件大厦2层西区申请人成都金山数字娱乐科技有限公司(72)发明人李长亮江凡汪美玲唐剑波(74)专利代理机构北京智信禾专利代理有限公司11637代理人吴肖肖(51)Int.Cl.G06F16/332(2019.01)G06F16/36(2019.01)权利要求书2页说明书8页附图6页(54)发明名称一种基于知识图谱的搜索方法及装置(57)摘要本申请提供一种基于知识图谱的搜索方法及装置,其中所述方法包括:获取来自用户的待搜索语句;对所述待搜索语句进行意图识别,确定所述待搜索语句的类型;基于命名实体识别和所述待搜索语句的类型,将所述待搜索语句解析为包含有实体和关系的节点查询语句;在预设的知识图谱的图数据库中搜索与所述节点查询语句匹配的三元组;在获取到与所述节点查询语句匹配的三元组的情况下,将所述三元组中的实体作为搜索结果返回至所述用户。CN110147437ACN110147437A权利要求书1/2页1.一种基于知识图谱的搜索方法,其特征在于,包括:获取来自用户的待搜索语句;对所述待搜索语句进行意图识别,确定所述待搜索语句的类型;基于命名实体识别和所述待搜索语句的类型,将所述待搜索语句解析为包含有实体和关系的节点查询语句;在预设的知识图谱的图数据库中搜索与所述节点查询语句匹配的三元组;在获取到与所述节点查询语句匹配的三元组的情况下,将所述三元组中的实体作为搜索结果返回至所述用户。2.根据权利要求1所述的方法,其特征在于,在获取来自用户的待搜索语句之前,还包括:从数据源中获取结构化数据和非结构化数据;将所述结构化数据和非结构化数据存储在分布式系统集群中;从所述分布式系统集群中提取多个三元组;根据所述多个三元组构建知识图谱并存储在图数据库中。3.根据权利要求1所述的方法,其特征在于,对所述待搜索语句进行意图识别,确定所述待搜索语句的类型包括:将所述待搜索语句分解为对应的词序列;将所述词序列输入意图识别模型进行意图识别并确定所述待搜索语句的类型,所述意图识别模型包括:意图识别组件,通过所述词序列识别所述待搜索语句的意图;类型确定组件,通过所述词序列确定出所述词序列中每个词的属性;类型选择组件,用来提供期望选取的对象的属性。4.根据权利要求3所述的方法,其特征在于,所述意图识别组件组包括双向长短期记忆网络模型和意图注意力意模型;所述类型确定组件包括槽位门模型和槽位注意力模型;所述类型选择组件为条件随机场。5.根据权利要求2所述的方法,其特征在于,还包括:在未获取到与所述节点查询语句匹配的三元组的情况下,对所述待搜索语句进行分词,得到所述待搜索语句对应的模糊查询检索词;根据所述待搜索语句对应的模糊查询检索词在所述分布式系统集群中进行模糊查询。6.根据权利要求5所述的方法,其特征在于,根据所述待搜索语句对应的模糊查询检索词在所述分布式系统集群中进行模糊查询包括:将所述分布式系统集群中的文档型数据存储在分布式全文搜索引擎的引擎库中;在所述分布式全文搜索引擎的引擎库中建立所述文档型数据的文档索引;基于所述待搜索语句对应的模糊查询检索词和文档索引,通过所述分布式全文搜索引擎在所述引擎库中进行搜索。7.一种基于知识图谱的搜索装置,其特征在于,包括:用户问句模块,被配置为获取来自用户的待搜索语句;意图识别模块,被配置为对所述待搜索语句进行意图识别,确定所述待搜索语句的类2CN110147437A权利要求书2/2页型;语句解析模块,被配置为基于命名实体识别和所述待搜索语句的类型,将所述待搜索语句解析为包含有实体和关系的节点查询语句;搜索模块,被配置为在预设的知识图谱的图数据库中搜索与所述节点查询语句匹配的三元组;结果返回模块,被配置为在获取到与所述节点查询语句匹配的三元组的情况下,将所述三元组中的实体作为搜索结果返回至所述用户。8.根据权利要求7所述的装置,其特征在于,还包括:数据获取模块,被配置为从数据源中获取结构化数据和非结构化数据;数据存储模块,被配置为将所述结构化数据和非结构化数据存储在分布式系统集群中;三元组提取模块,被配置为从所述分布式系统集群中提取多个三元组;三元组存储模块,被配置为根据所述多个三元组构建知识图谱并存储在图数据库中。9.一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,其特征在于,所述处理器执行所述指令时实现权利要求1-6任意一项所述方法的步骤。10.一种计算机可读存储介质,其存储有计算机指令,其特征在