预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利(10)授权公告号CN107908671B(45)授权公告日2022.02.01(21)申请号201711006520.3G06Q50/18(2012.01)(22)申请日2017.10.25(56)对比文件(65)同一申请的已公布的文献号CN107122444A,2017.09.01申请公布号CN107908671ACN106156365A,2016.11.23CN106815293A,2017.06.09(43)申请公布日2018.04.13CN102624782A,2012.08.01(73)专利权人南京擎盾信息科技有限公司CN104598535A,2015.05.06地址210000江苏省南京市雨花台区安德US2005197992A1,2005.09.08门大街21号江苏科技金融大厦2楼审查员田民丽专利权人杜向阳梁雁圆(72)发明人杜向阳梁雁圆(74)专利代理机构南京众联专利代理有限公司32206代理人叶涓涓(51)Int.Cl.G06F16/36(2019.01)权利要求书2页说明书6页附图4页(54)发明名称基于法律数据的知识图谱构建方法及系统(57)摘要本发明提供了基于法律数据的知识图谱构建方法及系统,方法包括:构建法律词典步骤,提取法律短语步骤,预处理法律文本步骤,初步构建法律知识步骤,识别法律实体步骤,识别法律关系步骤,构造法律知识链步骤;系统包括法律基础词典构建模块、法律基础知识库构建模块、法律实体自动识别模块、法律关系自动识别模块、法律知识链自动生成模块。本发明实现了针对法律数据构建知识图谱,能够在多个法律案由,如离婚纠纷、合同纠纷和机动车交通事故责任纠纷等案由数据构建知识图谱,为法律行业的上层应用提供了走向智能化的数据。CN107908671BCN107908671B权利要求书1/2页1.基于法律数据的知识图谱构建方法,其特征在于,包括如下步骤:步骤1,构建法律词典首先下载以及人工标注法律种子词库,同时训练法律文本语料得到法律词向量;然后计算与词向量相似的候选法律词,计算相似度公式为:其中W1,W2为法律词汇的词向量;最后筛选有效的候选法律词;步骤2,提取法律短语通过互信息和信息熵分别提取组合词语,综合这两种方式计算的分数,使用加权平均的方式做排序筛选出短语候选组;其中,互信息计算公式为:X和Y为两个法律词,P(X,Y)为X和Y的联合概率,P(X)、P(Y)为X和Y的概率;信息熵具体计算公式如下:其中,EL(W)、ER(W)分别是当前词的左熵和右熵,P(aW|W)为当前词左边出现词的条件概率,P(Wb|W)为当前词右边出现词的条件概率;步骤3,预处理法律文本将步骤1、步骤2中构建的法律词典、法律短语作为分词工具的扩展词,对原始法律文本数据进行分词、词性标注、句法分析,完成法律语料文本的预处理;步骤4,初步构建法律知识定义法律知识图谱中法律实体、法律关系、三元组、概念层次图,标注相关的法律数据语料;步骤5,识别法律实体对已标注的法律文本数据,进行实体特征的抽取,并将抽取的特征通过模型计算,实现法律实体自动识别,模型计算过程如下:句子沿着标签的路径,计算出概率转移矩阵和网络的分数表示为:其中,为模型的输入层,即输入的句子表示;[h(θ)]i,t为句子的第i个标签的第t个词;[P]i,j为转移概率矩阵表示对于一对连续的时间步长从第i个状态转换到第j个状态的转变矩阵;神经网络可训练的参数记为θ;模型所有参数可表示为2CN107908671B权利要求书2/2页步骤6、识别法律关系对法律专家标注的法律文本数据,使用法律关系规则模板,从文本中学习法律文本的关系表达式,采用机器学习与模板规则结合的方法提取法律关系;步骤7、构造法律知识链基于原始法律文本,采用步骤5和步骤6识别到的法律实体和法律关系,使用基于法律实体词和法律关系的法律事理图谱推理引擎来识别法律知识链。2.根据权利要求1所述的基于法律数据的知识图谱构建方法,其特征在于,所述步骤6包括如下具体过程:6.1、抽取法律文本的依存句法特征,制定关系抽取模板;6.2、对法律语料进行预处理,进行语义特征、关系类别特征的抽取;6.3、将抽取得到的特征值代入到关系抽取模型进行关系抽取;6.4、将6.3抽取得到的关系做为候选关系组,并将候选关系组做类型过滤。3.基于法律数据的知识图谱构建系统,其特征在于,用于实现权利要求1或2所述的基于法律数据的知识图谱构建方法,包括:法律基础词典构建模块、法律基础知识库构建模块、法律实体自动识别模块、法律关系自动识别模块、法律知识链自动生成模块;所述法律基础词典构建模块用于构建和扩充法律基础词典,实现所述基于法律数据的知识图谱构建方法中步骤1‑3;所述法律基础知识库构建模块用于构建法律专