预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113971207A(43)申请公布日2022.01.25(21)申请号202111308278.1(22)申请日2021.11.05(71)申请人讯飞智元信息科技有限公司地址230000安徽省合肥市高新区望江西路666号讯飞大厦8层-10层(72)发明人徐美君路姚王立人昕宇(74)专利代理机构深圳市威世博知识产权代理事务所(普通合伙)44280代理人刘希(51)Int.Cl.G06F16/33(2019.01)G06F16/338(2019.01)G06F40/194(2020.01)G06F40/258(2020.01)G06F40/30(2020.01)权利要求书2页说明书14页附图3页(54)发明名称文档关联方法及装置、电子设备和存储介质(57)摘要本申请公开了一种文档关联方法及装置、电子设备和存储介质,其中,文档关联方法包括:获取文档集合,文档集合包括若干文档,若干文档包括目标文档和至少一个待关联文档;识别目标文档中第一关键字段及其第一字段属性;其中,第一字段属性包括第一关键字段所属的第一字段类型;基于字段类型与文档类型之间的映射关系,在至少一个待关联文档中搜索得到与第一关键字段相关的候选文档;基于各个候选文档的校验结果,选择候选文档作为关联文档。上述方案,能够提高文档关联的质效。CN113971207ACN113971207A权利要求书1/2页1.一种文档关联方法,其特征在于,包括:获取文档集合;其中,所述文档集合包括若干文档,所述若干文档包括目标文档和至少一个待关联文档;识别所述目标文档中第一关键字段及其第一字段属性;其中,所述第一字段属性包括所述第一关键字段所属的第一字段类型;基于字段类型与文档类型之间的映射关系,在所述至少一个待关联文档中搜索得到与所述第一关键字段相关的候选文档;基于各个所述候选文档的校验结果,选择所述候选文档作为关联文档。2.根据权利要求1所述的方法,其特征在于,所述映射关系包括各个所述字段类型的子映射关系,且所述子映射关系包括所述字段类型以及与所述字段类型相关的至少一种所述文档类型。3.根据权利要求1所述的方法,其特征在于,所述基于字段类型与文档类型之间的映射关系,在所述至少一个待关联文档中搜索得到与所述第一关键字段相关的候选文档,包括:基于所述映射关系,选择与所述第一关键字段所属的第一字段类型相关的文档类型作为候选类型;基于所述候选类型与各个所述待关联文档的文档标题之间的相似度,选择所述待关联文档作为所述候选文档。4.根据权利要求1所述的方法,其特征在于,所述若干文档与至少一个目标人物相关,所述第一字段属性包括所述第一关键字段所涉及的目标人物,所述校验结果包括第一子结果、第二子结果中至少一者,所述第一子结果包括所述候选文档是否涉及所述目标人物,所述第二子结果包括所述候选文档是否合规合法。5.根据权利要求4所述的方法,其特征在于,所述校验结果包括所述第一子结果,且所述第一子结果的获取步骤包括:获取所述候选文档在第一预设位置处的第一数据;基于所述第一数据是否包含所述目标人物,获取所述第一子结果。6.根据权利要求4所述的方法,其特征在于,所述校验结果包括所述第二子结果,且所述第二子结果的获取步骤包括:获取所述候选文档在第二预设位置处的第二数据;基于所述第二数据是否包含印鉴信息,获取所述第二子结果。7.根据权利要求1所述的方法,其特征在于,在所述基于各个所述候选文档的校验结果,选择所述候选文档作为所述目标文档的关联文档之后,所述方法还包括:响应于用户在所述目标文档选择的第一关键字段,将所选择的第一关键字段作为目标关键字段;在文档显示界面同屏显示所述目标文档以及与所述目标关键字段对应的关联文档;其中,所述文档显示界面包括第一显示区域和第二显示区域,所述第一显示区域用于显示所述目标文档,所述第二显示区域用于显示关联文档。8.根据权利要求7所述的方法,其特征在于,不同所述文档类型具有不同优先级,所述第二显示区域按照所述优先级依序显示所述关联文档。9.根据权利要求7所述的方法,其特征在于,在所述在文档显示界面同屏显示所述目标2CN113971207A权利要求书2/2页文档以及于所述目标关键字段对应的关联文档之前,所述方法还包括:识别所述关联文档中第二关键字段及其第二字段属性;其中,所述第二字段属性包括所述第二关键字段所属的第二字段类型;选择所述第二字段类型与所述第一字段类型相关的第二关键字段,作为所述目标关键字段的关联关键字段;其中,所述第二显示区域以预设格式突出显示所述关联文档中的关联关键字段。10.根据权利要求1所述的方法,其特征在于,所述第一关键字段及其第一字段属性是基于语义识别模型、预设业务规则中至少一者对目标文档识别