预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115033708A(43)申请公布日2022.09.09(21)申请号202210553390.X(22)申请日2022.05.20(71)申请人阿里巴巴(北京)软件服务有限公司地址100102北京市朝阳区望京东园四区9号楼3层301号(72)发明人贺勇张顺曾震宇(74)专利代理机构北京太合九思知识产权代理有限公司11610专利代理师张爱刘戈(51)Int.Cl.G06F16/36(2019.01)G16H50/20(2018.01)权利要求书2页说明书12页附图4页(54)发明名称一种医疗知识图谱的构建方法、设备及存储介质(57)摘要本申请实施例提供一种医疗知识图谱的构建方法、设备及存储介质。可从真实的就诊医疗数据中抽取出诊断实体、医疗项目实体以及诊断实体与医疗项目实体之间的伴随关系;基于伴随关系分别计算各个诊断实体对各个医疗项目实体的亲和度以及各个医疗项目实体对各个诊断实体的亲和度;根据亲和度在诊断实体与医疗项目实体之间进行互选操作,以获得互选成功的实体对,从而构建出医疗知识图谱。这样,可基于大数据自动化构建出动态的医疗知识图谱,从而提高医疗知识图谱的构建效率;且通过诊断实体与医疗项目实体之间互选的方式,可在完全不需要人工干预的前提下,为诊断实体精准地、全面地选出更具代表性的医疗项目实体,以保证医疗知识图谱的质量。CN115033708ACN115033708A权利要求书1/2页1.一种医疗知识图谱的构建方法,包括:从指定范围的就诊医疗数据中,抽取诊断实体、医疗项目实体以及诊断实体与医疗项目实体之间的伴随关系,其中,出现在同一就诊医疗数据中的诊断实体和医疗项目实体之间具有伴随关系;基于所述伴随关系,分别计算各个诊断实体对各个医疗项目实体的亲和度以及各个医疗项目实体对各个诊断实体的亲和度;根据亲和度,在诊断实体与医疗项目实体之间进行互选操作,以获得互选成功的实体对;按照互选成功的实体对,构建医疗知识图谱。2.根据权利要求1所述的方法,所述按照互选成功的实体对,构建医疗知识图谱,包括:根据互选成功的实体对,确定与目标诊断实体配对的医疗项目实体;基于与目标诊断实体配对的医疗项目实体,构建以所述目标诊断实体为中心的医疗知识图谱。3.根据权利要求1所述的方法,所述基于所述伴随关系,分别计算各个诊断实体对各个医疗项目实体的亲和度以及各个医疗项目实体对各个诊断实体的亲和度,包括:基于所述伴随关系,计算使用目标医疗项目且诊断为目标诊断的就诊次数在所述目标诊断对应的就诊总次数中的占比,作为所述目标医疗项目实体对所述目标诊断实体的亲和度;基于所述伴随关系,计算使用所述目标医疗项目且诊断为所述目标诊断的就诊次数在使用所述目标医疗项目的就诊总次数中的占比,作为所述目标诊断实体对所述目标医疗项目实体的亲和度。4.根据权利要求1所述的方法,所述根据亲和度,在诊断实体与医疗项目实体之间进行互选操作,以获得互选成功的实体对,包括:在多个指定的项目类型中,确定目标医疗项目实体所属的目标项目类型;若目标诊断实体对所述目标医疗项目实体的亲和度和所述目标医疗项目实体对所述目标诊断实体的亲和度满足所述目标项目类型下要求的亲和度互选标准,则确定所述目标诊断实体和所述目标医疗项目互选成功。5.根据权利要求4所述的方法,还包括:按照各个诊断实体各自对所述目标医疗项目实体的亲和度,选择亲和度最大的m个诊断实体构成所述目标医疗项目实体对应的诊断实体集合;从所述目标项目类型下包含的各个医疗项目实体中,选择对所述目标诊断实体的亲和度最大的n个医疗项目实体构成所述目标诊断实体在所述目标项目类型下对应的医疗项目实体集合;若所述目标诊断实体处于所述诊断实体集合内且所述目标医疗项目实体位于所述医疗项目实体集合中,则确定所述目标诊断实体对所述目标医疗项目实体的亲和度和所述目标医疗项目实体对所述目标诊断实体的亲和度满足所述目标项目类型下要求的亲和度互选标准。6.根据权利要求4所述的方法,所述在多个指定的项目类型中,确定目标医疗项目实体所属的目标项目类型,包括:2CN115033708A权利要求书2/2页从所述就诊医疗数据中抽取所述目标医疗项目实体相关的描述文本;将所述描述文本输入预置的分类模型中;在所述分类模型中,基于描述文本与项目类型之间的映射关系,输出所述目标医疗项目实体所属的目标项目类型。7.根据权利要求1所述的方法,还包括:在所述医疗知识图谱中标注各个医疗项目实体所属的项目类型。8.根据权利要求1所述的方法,所述从指定范围的就诊医疗数据中,抽取诊断实体和医疗项目实体,包括:从所述就诊医疗数据中抽取诊断名称和医疗项目名称;对诊断名称和医疗项目名称分别进行归一化,以获得诊断实体和医疗项目实体。9.根据权利要求8所述的方法