预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115757834A(43)申请公布日2023.03.07(21)申请号202211583925.4(22)申请日2022.12.09(71)申请人竹间智能科技(上海)有限公司地址200030上海市徐汇区宜山路700号B2幢楼18层整层(72)发明人简仁贤(74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙)11463专利代理师周宇(51)Int.Cl.G06F16/36(2019.01)G06F16/335(2019.01)权利要求书2页说明书8页附图11页(54)发明名称知识抽取方法及装置、电子设备、存储介质(57)摘要本申请提供一种知识抽取方法及装置、电子设备、存储介质,方法包括:响应于文本导入指令,获取所述文本导入指令指示的目标文本;响应于知识图谱构建指令,依据指定抽取流程从所述目标文本中抽取出多个知识要素;根据所述多个知识要素,构建所述目标文本对应的知识图谱。本申请方案,实现对非结构数据的自动化知识抽取,提高知识抽取效率,并规范化了知识抽取结果。CN115757834ACN115757834A权利要求书1/2页1.一种知识抽取方法,其特征在于,包括:响应于文本导入指令,获取所述文本导入指令指示的目标文本;响应于知识图谱构建指令,依据指定抽取流程从所述目标文本中抽取出多个知识要素;根据所述多个知识要素,构建所述目标文本对应的知识图谱。2.根据权利要求1所述的方法,其特征在于,在所述响应于知识图谱构建指令,依据指定抽取流程从所述目标文本中抽取出多个知识要素之前,所述方法还包括:响应于流程选择指令,从预设抽取流程库中选择所述流程选择指令指示的抽取流程,作为构建知识图谱的指定抽取流程。3.根据权利要求2所述的方法,其特征在于,在所述响应于流程选择指令,从预设抽取流程库中选择所述流程选择指令指示的抽取流程,作为构建知识图谱的指定抽取流程之前,所述方法还包括:响应于抽取内容配置指令,确定多个待抽取内容;根据所述多个待抽取内容和所述多个待抽取内容对应的抽取算法,构建出抽取流程,并将已构建的抽取流程加入至所述抽取流程库。4.根据权利要求3所述的方法,其特征在于,在所述根据所述多个待抽取内容和所述多个待抽取内容对应的抽取算法,构建出抽取流程,并将已构建的抽取流程加入至所述抽取流程库之前,所述方法还包括:响应于训练指令,获取所述训练指令指示的多个样本文本;根据所述多个样本文本对基础抽取算法进行训练,获得已训练的抽取算法。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:在训练所述抽取算法的过程中,为每一样本文本抽取出与所述多个待抽取内容对应的知识要素,并根据抽取出的知识要素为每一样本文本构建对应的知识图谱。6.根据权利要求1所述的方法,其特征在于,在所述根据所述多个知识要素,构建所述目标文本对应的知识图谱之后,所述方法还包括:以结构化数据输出展示所述知识图谱中的多个知识要素。7.根据权利要求1所述的方法,其特征在于,在所述根据所述多个知识要素,构建所述目标文本对应的知识图谱之后,所述方法还包括:响应于针对所述目标文本的搜索指令,在所述目标文本的知识图谱中,查找与所述搜索指令指示的问题对应的知识要素;根据所述知识要素构建所述问题对应的答案,并输出展示所述答案。8.一种知识抽取装置,其特征在于,包括:获取模块,用于响应于文本导入指令,获取所述文本导入指令指示的目标文本;抽取模块,用于响应于知识图谱构建指令,依据指定抽取流程从所述目标文本中抽取出多个知识要素;构建模块,用于根据所述多个知识要素,构建所述目标文本对应的知识图谱。9.一种电子设备,其特征在于,所述电子设备包括:处理器;用于存储处理器可执行指令的存储器;2CN115757834A权利要求书2/2页其中,所述处理器被配置为执行权利要求1‑7任意一项所述的知识抽取方法。10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成权利要求1‑7任意一项所述的知识抽取方法。3CN115757834A说明书1/8页知识抽取方法及装置、电子设备、存储介质技术领域[0001]本申请涉及计算机技术领域,特别涉及一种知识抽取方法及装置、电子设备、计算机可读存储介质。背景技术[0002]普通文档属于非结构化数据,应用方式非常有限。这里,非结构化数据指的是不能由数据库二维表来表项的数据,包括所有格式的办公文档、XML(eXtensibleMarkupLanguage,可拓展标记语言)文档、HTML(HyperTextMarkupLanguage,超文本标记语言)、图片、音频、视频等。为更充分利用非结构数据中的知识,可以将非结构化数据转化为结构化数据,从而提升数据的应用维度。结构化