预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110197214A(43)申请公布日2019.09.03(21)申请号201910427251.0(22)申请日2019.05.22(71)申请人浙江大学地址310058浙江省杭州市西湖区余杭塘路866号(72)发明人段会龙吕旭东田琪蔡海领张健(74)专利代理机构杭州求是专利事务所有限公司33200代理人忻明年(51)Int.Cl.G06K9/62(2006.01)G16H10/00(2018.01)G16H10/60(2018.01)G06F21/30(2013.01)权利要求书1页说明书6页附图3页(54)发明名称一种基于多字段相似度计算的患者身份匹配方法(57)摘要本发明提供了一种基于多字段相似度计算的患者身份匹配方法,包括以下步骤:(1)设定用于确定相同患者的患者身份信息框架,该框架包括多个信息项;(2)将两患者记录的信息项的字段值转换为字段值字符串,并对字段值字符串作数据预处理;(3)逐一对经过步骤(2)处理后的两患者记录的同一信息项的字段值字符串进行相似度计算,得到各信息项相似度;(4)利用各信息项相似度进行计算,得到患者记录相似度;(5)将患者记录相似度与阈值比较,根据结果将患者记录归为同一患者、留待人工确认或是将患者记录归为不同患者。本发明提供的基于多字段相似度计算的患者身份匹配方法,可以解决现有患者身份匹配方法准确率、召回率较低的问题。CN110197214ACN110197214A权利要求书1/1页1.一种基于多字段相似度计算的患者身份匹配方法,其特征在于,包括以下步骤:(1)设定用于确定相同患者的患者身份信息框架,该框架包括多个信息项;(2)将两患者记录的信息项的字段值转换为字段值字符串,并对字段值字符串作数据预处理;(3)逐一对经过步骤(2)处理后的两患者记录的同一信息项的字段值字符串进行相似度计算,得到各信息项相似度;(4)利用各信息项相似度进行计算,得到患者记录相似度;(5)将患者记录相似度与阈值比较,根据结果将患者记录归为同一患者、留待人工确认或是将患者记录归为不同患者。2.根据权利要求1所述的基于多字段相似度计算的患者身份匹配方法,其特征在于,步骤(2)中的数据预处理包括:对于无效的信息项记录,将字段值字符串置空;对于有效的信息项记录,将同一信息项的字段值字符串调整为相同格式,对于地址类信息作必要的分词工作。3.根据权利要求1所述的基于多字段相似度计算的患者身份匹配方法,其特征在于,步骤(4)中,患者记录相似度的计算公式为:式中:Xi为第一患者记录;Yj为第二患者记录;k为信息项;Xik为第一患者记录的k信息项的字段值字符串;Yjk为第二患者记录的k信息项的字段值字符串;Sim(Xik,Yjk)为两患者的k信息项的信息项相似度;ak为k信息项的权重,各信息项的权重之和为1;Sim(Xi,Yj)为患者记录相似度。4.根据权利要求1所述的基于多字段相似度计算的患者身份匹配方法,其特征在于,步骤(3)中,计算字段值字符串的相似度的算法包括:距离度量算法,包括Euclidean算法,用于地址信息项的字段值字符串的相似度计算;相似性度量算法,包括Cosine算法、Dice算法、Jaccard算法和Overlap算法,用于地址信息项和分段处理后的数字信息项的字段值字符串的相似度计算;最长公共子序列算法,包括Needleman-Wunsch算法,用于地址信息项、数字信息项和语句信息项的字段值字符串的相似度计算;编辑距离算法,包括LevenshteinDistance算法、Smith-Waterman算法、Jaro算法和Jaro-Winkler算法,用于地址信息项、数字信息项和语句信息项的字段值字符串的相似度计算。2CN110197214A说明书1/6页一种基于多字段相似度计算的患者身份匹配方法技术领域[0001]本发明涉及医疗信息数据处理技术领域,特别是涉及一种基于多字段相似度计算的患者身份匹配方法。背景技术[0002]随着区域医疗信息化建设过程中大量医疗信息系统的集成,患者在各医疗信息系统中产生的患者信息对应了不同的患者身份标识,导致属于同一患者的记录信息难以实现关联、共享和利用,为医疗机构间的业务联动、业务协同和数据共享带来了困难,对区域医疗信息化的进程造成了阻碍。[0003]要解决这一问题,首先要解决的问题是如何判断患者记录是否属于同一患者实例,即患者身份的匹配问题。解决患者身份的匹配问题需要一种准确有效的患者身份匹配方法。[0004]目前,患者身份匹配算法往往是通过一些能够代表患者实例的关键信息项一致的情况判断记录是否匹配。所谓关键信息项通常是能够代表患者实例的重要标识符,例如姓名、出生日期、身份证号码、手机号码或该条记录