预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113609291A(43)申请公布日2021.11.05(21)申请号202110860579.9(22)申请日2021.07.27(71)申请人科大讯飞(苏州)科技有限公司地址215021江苏省苏州市工业园区金鸡湖大道88号E4单元(72)发明人李直旭陈志刚何莹牛雷(74)专利代理机构北京路浩知识产权代理有限公司11002代理人程琛(51)Int.Cl.G06F16/35(2019.01)G06F16/36(2019.01)权利要求书2页说明书15页附图4页(54)发明名称实体分类方法、装置、电子设备和存储介质(57)摘要本发明提供一种实体分类方法、装置、电子设备和存储介质,其中方法包括:确定目标实体及其候选类型;基于目标实体的实体表示和候选类型的类型表示,确定目标实体和候选类型的匹配结果,实体表示是基于对应实体的实体信息和/或实体三元组信息确定的,类型表示是基于对应类型的类型信息和/或类型三元组信息确定的;基于目标实体和候选类型的匹配结果,确定目标实体的实体类型。本发明提供的方法、装置、电子设备和存储介质,实现基于实体和类型的双视角实体分类,其中应用相较于实体的信息更加容易获取和维护的类型信息和/或类型三元组信息,获取信息丰富的类型表示,保证实体分类的可用性,提高实体分类的可靠性和准确性。CN113609291ACN113609291A权利要求书1/2页1.一种实体分类方法,其特征在于,包括:确定目标实体及其候选类型;基于所述目标实体的实体表示和所述候选类型的类型表示,确定所述目标实体和所述候选类型的匹配结果,所述实体表示是基于对应实体的实体信息和/或实体三元组信息确定的,所述类型表示是基于对应类型的类型信息和/或类型三元组信息确定的;基于所述目标实体和所述候选类型的匹配结果,确定所述目标实体的实体类型。2.根据权利要求1所述的实体分类方法,其特征在于,所述目标实体的实体表示是基于如下步骤确定的:基于所述实体信息中的实体名称和/或实体摘要文本,确定所述目标实体的实体信息表示;和/或,基于所述实体三元组信息中的谓词和尾部,确定所述实体三元组信息的实体三元组表示;基于所述实体信息表示或所述实体三元组表示,或基于所述实体信息表示和所述实体三元组表示之间的相关性,确定所述目标实体的实体表示。3.根据权利要求2所述的实体分类方法,其特征在于,所述基于所述实体三元组信息中的谓词和尾部,确定所述实体三元组信息的实体三元组表示,包括:基于所述实体三元组信息中的谓词表示和尾部表示之间的相关性,确定所述实体三元组表示;其中,所述谓词表示是基于所述目标实体对应的各三元组中的谓词及其头实体的重合情况确定的,所述尾部表示是基于所述目标实体对应的各三元组中尾部的语义确定的。4.根据权利要求3所述的实体分类方法,其特征在于,所述谓词表示是基于如下步骤确定的:以所述目标实体对应的各三元组中谓词为节点,以谓词的头实体的重合情况为边权重,构建谓词关系图;基于所述谓词关系图,确定所述谓词表示。5.根据权利要求1所述的实体分类方法,其特征在于,所述候选类型的类型表示是基于如下步骤确定的:基于所述类型信息中的类型名称和/或类型摘要文本,确定所述候选类型的类型信息表示;和/或,基于所述类型三元组信息中的类型关系和尾部类型,确定所述候选类型的类型三元组表示;基于所述类型信息表示或所述类型三元组表示,或基于所述类型信息表示和所述类型三元组表示之间的相关性,确定所述候选类型的类型表示。6.根据权利要求5所述的实体分类方法,其特征在于,所述基于所述类型三元组信息中的类型关系和尾部类型,确定所述候选类型的类型三元组表示,包括:基于所述三元组信息中的类型关系表示和尾部类型表示之间的相关性,确定所述实体三元组表示;所述类型关系表示是基于所述候选类型对应的各三元组中类型关系的语义确定的,所述尾部类型表示是基于所述候选类型对应的各三元组中尾部类型的语义确定的。2CN113609291A权利要求书2/2页7.根据权利要求1至6中任一项所述的实体分类方法,其特征在于,所述基于所述目标实体和所述候选类型的匹配结果,确定所述目标实体的实体类型,包括:从各候选类型中,选取与所述目标实体的匹配结果的得分最高的候选类型,作为所述目标实体的实体类型。8.一种实体分类装置,其特征在于,包括:确定单元,用于确定目标实体及其候选类型;匹配单元,用于基于所述目标实体的实体表示和所述候选类型的类型表示,确定所述目标实体和所述候选类型的匹配结果,所述实体表示是基于对应实体的实体信息和/或实体三元组信息确定的,所述类型表示是基于对应类型的类型信息和/或类型三元组信息确定的;分类单元,用于基于所述目标实体和所述候选类型的匹配结果,确定所