预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113688255A(43)申请公布日2021.11.23(21)申请号202111026407.8G16H10/60(2018.01)(22)申请日2021.09.02(71)申请人大连理工大学地址116024辽宁省大连市甘井子区凌工路2号(72)发明人李丽双袁光辉唐婧尧(74)专利代理机构大连理工大学专利中心21200代理人温福雪(51)Int.Cl.G06F16/36(2019.01)G06F16/35(2019.01)G06F16/28(2019.01)G06F40/216(2020.01)G06F40/295(2020.01)权利要求书4页说明书8页附图3页(54)发明名称一种基于中文电子病历的知识图谱构建方法(57)摘要本发明属于自然语言处理领域,提供了一种基于中文电子病历的知识图谱构建方法。当前已构建的大多数知识图谱所包含的病历语料数目较少,知识图谱规模不大,且往往只适用于单一科室或疾病,通用性较差,而一些做的比较完善的病历知识图谱又需要大量的人工参与,费时费力、可扩展性差。电子病历不同科室和疾病之间由于描述疾病类别不同,所对应的一系列检查和治疗等语言环境也有所不同,不同疾病类别所对应的医生习惯用语不同,这些特点使得一些深度学习方法效果下降,知识图谱构建框架不易扩展。针对上述存在的问题制定了基于中文电子病历的知识图谱数据分析处理方法、语料标注流程规范、及实体关系抽取方案。CN113688255ACN113688255A权利要求书1/4页1.一种基于中文电子病历的知识图谱构建方法,其特征在于包括如下步骤:步骤1、中文电子病历语料的预处理(1)语料拆分:根据电子病历中的标签对病历进行拆分,每个标签下对应的为用自然语言形式描述的医学知识;(2)标签归类:对标签进行手工归类,将包含相同方向医学知识的标签放在一个集合;(3)标签数量统计和筛选:统计所有集合包含标签的数量,按数量多少对标签集合进行排序;然后依据统计的标签集合数量从中抽取了几个包含标签较多的集合作为本申请知识图谱构建的语料;步骤2、数据标注规则及标注流程的制定(1)实体标注规范:将实体类型分为五个类别:疾病、部位、症状、检查和治疗;对五个实体类型的详细介绍如下:疾病:泛指病人身体或心理上出现的非正常现象,或者是由医生根据病人身体做出的诊断,可分为两类:传染性疾病和非传染性疾病,一般情况下,疾病会对人的正常生活产生不利影响;部位:泛指人身体的一部分,包括体外的和身体内部的,在医学病理上,部位一般是伴随着疾病或症状而出现;症状:泛指由疾病或其它突发状况导致的不适或异常感觉,或者在医院,医生给定异常诊断结果,设备的异常检查结果等;检查:泛指为了确认是否存在疾病,或了解疾病的更多细节而进行的检查项目、查体、实施的检查设备等;治疗:泛指针对疾病或症状而采取的用药方法、手术或设备等治疗手段;(2)关系标注规范根据以上确定的实体类型,进一步将实体之间的关系类型分为七个大类:疾病与疾病的关系、疾病与部位的关系、疾病与症状的关系、治疗与疾病的关系、治疗与症状的关系、检查与疾病的关系和检查与症状的关系,其中有的大类中还有细分的小类;具体如下:第一大类,疾病与疾病:疾病与疾病的关系有相关的并发症、疾病表明疾病或者疾病的别名等,本申请将这些关系统一归为一个大类;第二大类,疾病与部位:疾病体现在部位,一般指发病部位,也有转移部位等情况;第三大类,疾病与症状:疾病的一种体现形式,一般指疾病导致的某种症状;第四大类,治疗与疾病:治疗与疾病之间的关系,根据结果可细分为如下四类:治疗改善疾病:表示治疗针对于该疾病且疾病好转或治愈;治疗恶化疾病:表示针对该疾病的治疗导致病情恶化;治疗导致疾病:表示因治疗而出现的疾病;治疗管理疾病:治疗被应用于该疾病,没有提及治疗效果;第五大类,治疗与症状:针对某些症状采取的治疗,本申请将其关系分为两种:对症治疗:针对某些症状采取的治疗手段,这里不细分治疗结果;治疗导致症状:因采用此种治疗方式所产生的症状;第六大类,检查与疾病:通过设备或其它检查方法确认疾病,根据是否出现检查结果可用分为两类:2CN113688255A权利要求书2/4页检查证实了疾病:检查确认了该疾病的发生;为证实疾病而采取的检查:表示为了证实疾病而采取某种检查手段,结果未知;第七大类,检查与症状:检查显示症状,可以是正常症状或者异常症状,或者检查确认是否存在症状;(3)语料标注流程首先对实体进行规则匹配的方式抽取,然后对抽取出的实体,做实体关系的标注;实体关系标注的主要流程如下:标注数据准备:首先,进行①实体配对:每一份病历文本会匹配到多个实体,本发明根据实体类型和实体之间的距离来配对实体;此处实体之间的距离不是字符间