预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共28页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113704392A(43)申请公布日2021.11.26(21)申请号202110393735.5G06N3/04(2006.01)(22)申请日2021.04.13G06N3/08(2006.01)(71)申请人腾讯科技(深圳)有限公司地址518057广东省深圳市南山区高新区科技中一路腾讯大厦35层(72)发明人郑恒毅文瑞陈曦(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人祝亚男(51)Int.Cl.G06F16/33(2019.01)G06F16/335(2019.01)G06F16/36(2019.01)G06F40/126(2020.01)G06F40/295(2020.01)权利要求书3页说明书18页附图6页(54)发明名称文本中实体关系的抽取方法、装置、设备及存储介质(57)摘要本申请公开了一种文本中实体关系的抽取方法、装置、设备及存储介质,涉及人工智能领域。方法包括:对目标文本进行编码,得到目标文本中各个词对应的词向量;基于各个词对应的词向量,确定目标文本对应的潜在实体关系,目标文本中存在潜在实体关系的概率高于存在潜在实体关系外其它候选实体关系的概率;基于潜在实体关系以及各个词对应的词向量,确定目标文本中的目标主体和目标客体,目标主体和目标客体属于实体;基于目标主体、潜在实体关系以及目标客体,从目标文本中抽取实体关系三元组。通过对候选实体关系进行筛选得到潜在实体关系,减少冗余实体关系造成的误召回结果,提高文本中实体关系提取的准确性,并有助于提高实体关系的提取效率。CN113704392ACN113704392A权利要求书1/3页1.一种文本中实体关系的抽取方法,其特征在于,所述方法包括:对目标文本进行编码,得到所述目标文本中各个词对应的词向量;基于各个词对应的所述词向量,确定所述目标文本对应的潜在实体关系,所述目标文本中存在所述潜在实体关系的概率高于存在所述潜在实体关系外其它候选实体关系的概率;基于所述潜在实体关系以及各个词对应的所述词向量,确定所述目标文本中的目标主体和目标客体,所述目标主体和所述目标客体属于实体;基于所述目标主体、所述潜在实体关系以及所述目标客体,从所述目标文本中抽取实体关系三元组。2.根据权利要求1所述的方法,其特征在于,所述基于各个词对应的所述词向量,确定所述目标文本对应的潜在实体关系,包括:基于各个词对应的所述词向量,确定所述目标文本对应的文本向量;通过全连接层对所述文本向量进行分类,得到各种候选实体关系对应的存在概率,所述存在概率指所述目标文本中存在所述候选实体关系的概率;基于所述存在概率从所述候选实体关系中确定所述潜在实体关系。3.根据权利要求2所述的方法,其特征在于,所述基于各个词对应的所述词向量,确定所述目标文本对应的文本向量,包括:对各个词对应的所述词向量进行平均池化处理,得到所述目标文本对应的所述文本向量,所述文本向量与所述词向量具有相同维度。4.根据权利要求1至3任一所述的方法,其特征在于,所述基于所述潜在实体关系以及各个词对应的所述词向量,确定所述目标文本中的目标主体和目标客体,包括:对所述词向量和所述潜在实体关系对应的关系向量进行融合,得到具有潜在实体关系的词向量;基于所述具有潜在实体关系的词向量进行序列标注,确定所述目标文本中的所述目标主体和所述目标客体。5.根据权利要求4所述的方法,其特征在于,所述基于所述具有潜在实体关系的词向量进行序列标注,确定所述目标文本中的所述目标主体和所述目标客体,包括:基于所述具有潜在实体关系的词向量进行主体序列标注,得到主体标注结果,所述主体标注结果用于表征所述具有潜在实体关系的词向量的第一实体位置,所述第一实体位置包括主体开头、主体内部或主体外部;基于所述具有潜在实体关系的词向量进行客体序列标注,得到客体标注结果,所述客体标注结果用于表征所述具有潜在实体关系的词向量的第二实体位置,所述第二实体位置包括客体开头、客体内部或客体外部;基于所述主体标注结果和所述客体标注结果,确定所述目标文本中的所述目标主体和所述目标客体。6.根据权利要求1至3任一所述的方法,其特征在于,所述基于所述目标主体、所述潜在实体关系以及所述目标客体,从所述目标文本中抽取实体关系三元组,包括:对具有相同潜在实体关系的所述目标主体和所述目标客体进行组合,得到至少一个主客体对;2CN113704392A权利要求书2/3页确定各个所述主客体对的置信度;若所述主客体对的置信度高于置信度阈值,基于所述主客体对中的所述目标主体、所述目标客体以及所述潜在实体关系生成所述实体关系三元组。7.根据权利要求6所述的方法,其特征在于,所述确定各个所述主客体对的置信度,包括:将全局对应关