预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115840805A(43)申请公布日2023.03.24(21)申请号202211605555.XG06F40/295(2020.01)(22)申请日2022.12.14(71)申请人河北工业大学地址300000天津市北辰区双口镇西平道5340号(72)发明人王利琴杨树帆王旭许智宏董永峰(74)专利代理机构天津企兴智财知识产权代理有限公司12226专利代理师韩敏(51)Int.Cl.G06F16/332(2019.01)G06F16/36(2019.01)G06N3/0442(2023.01)G06N3/084(2023.01)权利要求书2页说明书8页附图3页(54)发明名称基于计算机学科知识图谱的智能问答系统的构建方法(57)摘要本发明提供了一种基于计算机学科知识图谱的智能问答系统的构建方法,首先构建计算机学科本体,然后利用爬虫技术采集电子图书和百度百科等非结构化数据,基于Colabeler工具、BiLSTM‑CRF、BiLSTM‑ATT完成知识加工,将抽取到的实体、关系等数据存储到Neo4j,最后基于后端Flask框架和前端React框架建立智能问答系统。首先对问题进行关键词抽取、模版匹配,若没有匹配到答案,则对问题进行相关度分析,并将问题存储至关系数据库,由教师解答,采用知识抽取模型抽取教师答案有效信息,补充至知识图谱中,实现知识图谱更新。本发明具有数据结构化、存储精细化、问答智能化三大特点,解决计算机学科数据零散不规则、学科知识粒度粗、搜索结果不准确等痛点问题。CN115840805ACN115840805A权利要求书1/2页1.基于计算机学科知识图谱的智能问答系统的构建方法,其特征在于,应用于计算机学科知识的辅助学习,构建方法为:(1)本体构建:采用自顶向下的方法确定计算机学科领域实体类型为课程类实体、概念类实体、操作类实体和方法类实体,确定关系为概念层级关系、前后序关系和关联关系;(2)计算机学科数据获取:数据源一部分为计算机学科电子图书数据,另一部分为基于Python网络爬虫在百度百科上爬取的相关数据,初步过滤和整合后,得到原始文本数据集;(3)知识加工:通过Colabeler工具及python标注部分的原始数据集,生成实体数据集和关系数据集;采用BiLSTM‑CRF,即BiLongShort‑TermMemory‑ConditionalRandomField模型完成实体识别;采用BiLSTM‑ATT,即BiLongShort‑TermMemory‑Attention模型完成关系抽取;(4)计算机学科知识图谱构建:将抽取到的实体和关系进行去重和对齐操作,生成实体列表和关系列表并存入图数据库Neo4j;(5)智能问答系统构建:基于后端Flask框架和前端React框架建立智能问答系统,通过问答的众包模式进行数据不间断扩充更新,在智能问答中,首先对学生问题进行关键词抽取、模版匹配,在系统查询到数据后,以对话方式可视化返回结果;若没有匹配到数据,则对问题进行相关度分析,返回与问题相关的知识点,并将该问题存储至关系型数据库,扩充原始数据源;然后教师对未匹配到答案的学生问题进行解答,采用知识抽取模型抽取教师答案有效信息,补充至知识图谱中,实现知识图谱更新。2.根据权利要求1所述的基于计算机学科知识图谱的智能问答系统的构建方法,其特征在于,步骤(1)中,本体构建定义了课程、概念、操作、方法四类实体。课程类实体代表学科中含有的课程,概念类实体代表课程中包含的重要概念,操作类实体代表具体的知识单元,方法类实体代表具体的知识点,是知识的最小单元,定义了概念层级、前后续、关联三类关系,其中,概念层级关系代表不同类别实体之间的包含关系,前后序关系代表同类实体之间学习顺序的前后关系,关系关联关系代表同类实体之间的关联关系,定义标准为同题同现原则。3.根据权利要求1所述的基于计算机学科知识图谱的智能问答系统的构建方法,其特征在于,步骤(2)中,计算机学科数据包括计算机学科电子图书数据和基于Python网络爬虫在百度百科上爬取的相关数据,从不同数据源中融合出统一的信息,将数据输出保存为UTF‑8,输出为txt文件格式。4.根据权利要求1所述的基于计算机学科知识图谱的智能问答系统的构建方法,其特征在于,步骤(3)中,实体标注规则采用BIO格式,将每个元素标注为“B‑N”、“I‑N”或者“O”,N表示课程、概念、操作、方法四类实体,关系标注采用<实体1实体2关系实体所在句子>的格式标注。5.根据权利要求1所述的基于计算机学科知识图谱的智能问答系统的构建方法,其特征在于,步骤(4)计算机学科知识图谱构建,具体包括:首先,分别构建实体和关系的同义映射表,实现相同含义实体或关系映射到唯