预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115878813A(43)申请公布日2023.03.31(21)申请号202211474722.1G06N5/022(2023.01)(22)申请日2022.11.23G06N20/00(2019.01)(71)申请人电信科学技术第五研究所有限公司地址610000四川省成都市锦江区大慈寺路22号(72)发明人曾山松张磊余安东胡佳(74)专利代理机构北京天奇智新知识产权代理有限公司11340专利代理师杨春(51)Int.Cl.G06F16/36(2019.01)G06F40/295(2020.01)G06F16/28(2019.01)G06F18/24(2023.01)G06F18/214(2023.01)权利要求书2页说明书5页附图2页(54)发明名称基于远程监督和提示学习的实体属性生成方法及系统(57)摘要本发明公开了基于远程监督和提示学习的实体属性生成方法及系统,涉及知识图谱领域,方法包括S1构建知识图谱;S2实体e、e的ake、及ave组成的三元组,在开放文档库D中检索e和ave,召回文本集合De;S3将De中正确表达ake的de标注为正例文本se,集合C为三元组与se组成的四元组集合;S4获取文本x;S5识别x中e,抽取e的ake;promptS6将x、e和ake转化成x;S7获得实体的属性值;系统包括知识图谱、开放文档数据库、提示学习模板引擎、预训练语言模块和实体识别模块;将提示学习用于实体属性抽取中,以有效解决了传统分类器存在的问题。CN115878813ACN115878813A权利要求书1/2页1.基于远程监督和提示学习的实体属性生成方法,其特征在于,包括:S1、构建知识图谱G={E,R,A},其中E为知识图谱中各个实体的集合,R为知识图谱中各个关系的集合,A={a}为知识图谱中各个属性组成的集合,a是一个包含属性名ak和属性值av的二元组;S2、利用远程监督方法,将知识图谱中的实体e∈E、实体e的属性名ake、及其属性名ake对应的属性值ave组成的三元组(e,ake,ave)作为种子,通过实体e和属性值ave到开放文档库D中去检索,召回同时包含实体e和属性值ave的文本集合De={de};S3、将文本集合De中能够正确表达属性类型ake的文本de标注为正例文本se∈Se,定义集合C={(e,ake,ave,se)}为知识图谱中所有种子三元组(e,ake,ave)召回的正例文本se组成的四元组集合;S4、获取待生成实体属性的文本x;S5、利用实体识别模型识别文本x中每个实体e,并抽取实体e的属性名ake;S6、通过fprompt(x,e,ake)将文本x、实体e、属性名ake转化成提示学习任务的输入形式xprompt;S7、将xprompt作为预训练语言模型BERT的输入,获得文本x中实体的属性值。2.根据权利要求1所述的基于远程监督和提示学习的实体属性生成方法,其特征在于,fprompt(x,e,ake)包括以下步骤:1)、定义模板t表示为:[x];属性抽取:【实体】[e]‑【属性名】[a]‑【答案】[z]模板内容t为一段由输入槽位[x]和实体槽[e],实体属性槽[ake],答案槽位[z]拼接而成的文本字符串,其中输入槽[x]、实体槽[e]、实体属性槽[ake]分别是基于提示学习的属性抽取任务的输入文本x、实体e、及其实体e需要抽取属性的名称ake的占位符,答案槽[z]是实体e需要抽取属性的值ave的占位符;2)、把输入的文本x填充模板t输入槽[x]的位置,实体e填充到模板t实体槽[e],实体e需要抽取属性的名称ake填充到模板t实体属性槽[ake];3)、返回填充后的字符串作为输入x的提示形式。3.根据权利要求1所述的基于远程监督和提示学习的实体属性生成方法,其特征在于,在S7中包括:S71、将xprompt作为预训练语言模型BERT的输入,让其预测xprompt中槽位[z]填入的单词词汇的概率分布;S72、取概率值最大的单词插入槽位[z]之前,形成新的提示学习模板:xprompt=insert_before(xprompt,[z],max_probability(v))其中v代表文档词汇库中的词汇,max_probability(v)代表取概率最大的词汇;insert_before函数为执行上述插入操作以修改当前样本;S73、判断生成的单词是否是句子的结束单词“。”,若是则进入S74,反之,则用修改后的当前样本返回S71;S74、将修改后的当前样本中的终止符合“。”删除,并作为实体的属性值。4.基于远程监督和提示学习的实体属性生成系统,其特征在于,包括:知识图谱;知识图谱中存储实体,关系,属性等三元组信息,2CN115878813A权利要