预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN116028636A(43)申请公布日2023.04.28(21)申请号202211377886.2G06F40/30(2020.01)(22)申请日2022.11.04G06N3/044(2023.01)G06N3/0464(2023.01)(71)申请人南方电网数字电网研究院有限公司G06N3/0895(2023.01)地址510555广东省广州市黄埔区中新广州知识城亿创街1号406房之86(72)发明人邵晶晶王尧宋云奎沈宇红柴雁欣甘莹郭彤彤符飞虎(74)专利代理机构北京世誉鑫诚专利代理有限公司11368专利代理师李世端(51)Int.Cl.G06F16/36(2019.01)G06F16/33(2019.01)G06F16/35(2019.01)G06F40/211(2020.01)权利要求书1页说明书4页附图1页(54)发明名称一种基于自学习的电网知识图谱构建方法(57)摘要本发明提供的一种基于自学习的电网知识图谱构建方法,所述构建方法包括:采用bootstrapping句法模板以及远监督的方案来构建样本;基于所述样本采用pipeline的方式来进行开放知识挖掘;采用多维度低资源信息的抽取,获得抽取信息;对所述抽取信息进行融合,获得融合信息;根据所述融合信息构建电网知识图谱。解决数据+学习的自组织难题,实现知识体系构建从人工编辑到半自动构建的跨越,实现了电力知识体系的深度沉淀和自动迭代更新。CN116028636ACN116028636A权利要求书1/1页1.一种基于自学习的电网知识图谱构建方法,其特征在于,所述构建方法包括:采用bootstrapping句法模板以及远监督的方案来构建样本;基于所述样本采用pipeline的方式来进行开放知识挖掘;采用多维度低资源信息的抽取,获得抽取信息;对所述抽取信息进行融合,获得融合信息;根据所述融合信息构建电网知识图谱。2.根据权利要求1所述的一种基于自学习的电网知识图谱构建方法,其特征在于,所述基于所述样本采用pipeline的方式来进行开放知识挖掘具体包括:先做关系分类判定,再对确定的关系类型进行序列标注subject及object。3.根据权利要求1所述的一种基于自学习的电网知识图谱构建方法,其特征在于,所述采用多维度低资源信息的抽取,获得抽取信息具体包括:综合运用基于电力行业适配语料的持续预训练技术、行业词汇增强技术、标签翻转主动学习技术、Positive‑unlabeled半监督学习技术及少次学习技术记性资源信息抽取。4.根据权利要求1所述的一种基于自学习的电网知识图谱构建方法,其特征在于,所述对所述抽取信息进行融合,获得融合信息具体包括:采用融合深度学习语义匹配模型、基于电力词林的术语成分分析及基于MobileNet电力多模态信息匹配的消歧技术,对所述抽取信息融合。5.根据权利要求4所述的一种基于自学习的电网知识图谱构建方法,其特征在于,所述多模态信息匹配具体包括:多模态数据特征表示;多模态数据语义关系计算。6.根据权利要求5所述的一种基于自学习的电网知识图谱构建方法,其特征在于,所述多模态数据特征表示具体包括:在对多模态数据进行关系计算前,首行需要提取多模态数据的特征表示;根据各类数据情况,采取相应的特征表示方法。7.根据权利要求5所述的一种基于自学习的电网知识图谱构建方法,其特征在于,所述多模态数据语义关系计算具体包括:采用了基于多模态类型数据的细粒度上下文信息,同时实现至少3种以上不同模态数据类型之间的语义对齐和分布对齐。2CN116028636A说明书1/4页一种基于自学习的电网知识图谱构建方法技术领域[0001]本发明涉及电网知识图谱领域,尤其涉及一种基于自学习的电网知识图谱构建方法。背景技术[0002]现有技术中电网领域数据集面临知识稀疏、知识分散等问题;具备深度知识的行业知识图谱快速工业化能力严重不足、人员投入成本不可控等问题。发明内容[0003]鉴于上述问题,提出了本发明以便提供克服上述问题或者至少部分地解决上述问题的一种基于自学习的电网知识图谱构建方法。[0004]根据本发明的一个方面,提供了一种基于自学习的电网知识图谱构建方法,所述构建方法包括:[0005]采用bootstrapping句法模板以及远监督的方案来构建样本;[0006]基于所述样本采用pipeline的方式来进行开放知识挖掘;[0007]采用多维度低资源信息的抽取,获得抽取信息;[0008]对所述抽取信息进行融合,获得融合信息;[0009]根据所述融合信息构建电网知识图谱。[0010]可选的,所述基于所述样本采用pipeline的方式来进行开放知识挖掘具体包括:先做关系分类判定,再对确定的关系类型进行序列标注subjec