预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115936436A(43)申请公布日2023.04.07(21)申请号202211665467.9G06F40/30(2020.01)(22)申请日2022.12.23(71)申请人厦门易法通法务信息管理股份有限公司地址361000福建省厦门市湖里区安岭路1001号801室之一(72)发明人张天金谢华平李岚施秋勇洪思睿(74)专利代理机构厦门仕诚联合知识产权代理事务所(普通合伙)35227专利代理师陈蓓蓓(51)Int.Cl.G06Q10/0635(2023.01)G06Q50/18(2012.01)G06F40/284(2020.01)权利要求书2页说明书9页附图2页(54)发明名称一种合同风险点识别方法以及装置(57)摘要本发明公开了一种合同风险点识别方法以及装置,包括:构建并训练用于对合同风险点检测的合同风险点识别模型;将待识别合同进行预处理后得到的条款文本集输入训练完成的所述合同风险点识别模型中,通过所述词汇相关性召回模块进行相似文本搜索,得到搜索结果,并对所述搜索结果进行处理,得到数据对;通过所述语义相关性召回模块对所述条款文本集进行向量化,得到高维条款向量,并对所述高维条款向量进行向量检索,得到预设数量的相似条款;将所述数据对以及所述相似条款根据风险点进行合并,得到所述风险点的条款召回集,通过所述语义排序模块对所述条款召回集进行语义相关性排序,得到条款风险点识别结果。能够降低合同风险点的漏检或错检的概率。CN115936436ACN115936436A权利要求书1/2页1.一种合同风险点识别方法,其特征在于,所述方法包括:构建并训练用于对合同风险点检测的合同风险点识别模型,所述合同风险点识别模型包括词汇相关性召回模块、语义相关性召回模块以及语义排序模块;将待识别合同进行预处理后得到的条款文本集输入训练完成的所述合同风险点识别模型中,通过所述词汇相关性召回模块进行相似文本搜索,得到搜索结果,并对所述搜索结果进行处理,得到数据对;通过所述语义相关性召回模块对所述条款文本集进行向量化,得到高维条款向量,并对所述高维条款向量进行向量检索,得到预设数量的相似条款;将所述数据对以及所述相似条款根据风险点进行合并,得到所述风险点的条款召回集,通过所述语义排序模块对所述条款召回集进行语义相关性排序,得到条款风险点识别结果。2.根据权利要求1所述的一种合同风险点识别方法,其特征在于,所述词汇相关性召回模块基于ES数据库进行搭建;在训练时,将法律合同文件中通过人工标注的合同条款和风险点作为样本数据输入所搭建的所述ES数据库进行训练,得到所述词汇相关性召回模块。3.根据权利要求2所述的一种合同风险点识别方法,其特征在于,所述语义相关性召回模块基于Milvus向量数据库进行搭建;在训练时,利用自适应领域增强将法律合同文件输入预训练语言模型进行训练,得到增强后的所述预训练语言模型对标注有风险点的合同条款进行向量化,得到高维条款向量存储于所述Milvus向量数据库,得到所述语义相关性召回模块。4.根据权利要求2所述的一种合同风险点识别方法,其特征在于,所述语义排序模块利用深度语义匹配模型作为模型框架;通过所构建的正负样本作为样本数据输入所述深度语义匹配模型进行训练,得到所述语义排序模块;其中,所述正负样本包括将每一风险点的预设标准表述条款与所述ES数据库中对应的风险点的所有标注的合同条款进行两两组合。5.根据权利要求1所述的一种合同风险点识别方法,其特征在于,所述通过所述词汇相关性召回模块进行相似文本搜索,得到搜索结果,并对所述搜索结果进行处理,得到数据对,包括:筛选所述条款文本集中的条款文本长度大于第一阈值的合同条款作为检索条款,输入所述词汇相关性召回模块进行相似文本搜索,得到所述搜索结果;将所述搜索结果按照词汇相关性的高低进行排序后并以预设数据结构的返回结果输出,所述预设数据结构包括合同条款、风险点、相关性分数;将所述返回结果按照风险点进行聚合,并对聚合的风险点的所述相关性分数进行求和,将求和后的分数大于第二阈值的所述检索条款以及所述返回结果进行组合,作为所述数据对。6.根据权利要求5所述的一种合同风险点识别方法,其特征在于,所述通过所述语义排序模块对所述条款召回集进行语义相关性排序,得到条款风险点识别结果,包括:通过所述语义排序模块对每一风险点的预设标准表述条款与所述条款召回集进行语义相关性排序,获取预设数量的输出结果;选取所述输出结果中对应的所述相关性分数大于第三阈值的所述检索条款,基于所述检索条款确定对应的合同条款以及风险点,得到所述条款风险点识别结果。2CN115936436A权利要求书2/2页7.一种合同风险点识别装置,其特征在于,所述装置包括:模型构建单元,用于