预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共28页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112307216A(43)申请公布日2021.02.02(21)申请号202010750770.3(22)申请日2020.07.30(71)申请人北京沃东天骏信息技术有限公司地址100176北京市大兴区经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人杨帅谢佩文豪韩磊张亚(74)专利代理机构北京英赛嘉华知识产权代理有限责任公司11204代理人王达佐马晓亚(51)Int.Cl.G06F16/36(2019.01)G06F40/295(2020.01)权利要求书2页说明书17页附图8页(54)发明名称药品知识图谱的构建方法和装置(57)摘要本申请公开了药品知识图谱的构建方法和装置。该方法的一具体实施方式包括:识别药品文本中的实体;采用符合预设规则的字符串,替换实体中的医药关键实体,得到替换文本;将基于替换文本所确定的分词结果中的字符串,还原为被字符串所替换的医药关键实体;基于实体,形成各个实体之间的实体线性关系;根据对实体线性关系进行句法解析得到的解析结果,生成药品知识图谱。该实施方式提高了医学知识图谱的准确性。CN112307216ACN112307216A权利要求书1/2页1.一种药品知识图谱的构建方法,所述方法包括:识别所述药品文本中的实体;采用符合预设规则的字符串,替换所述实体中的医药关键实体,得到替换文本;将基于所述替换文本所确定的分词结果中的所述字符串,还原为被所述字符串所替换的所述医药关键实体;基于所述实体,形成各个实体之间的实体线性关系;根据对所述实体线性关系进行句法解析得到的解析结果,生成药品知识图谱。2.根据权利要求1所述的方法,所述方法还包括:建立所述字符串与所述被所述字符串所替换的医药关键实体之间的映射关系表。3.根据权利要求2所述的方法,所述方法还包括:识别所述分词结果中的医药非关键实体;以及所述基于所述实体,形成各个实体之间的实体线性关系,包括:将所述医药关键实体、所述医药非关键实体按照所述药品文本中的各个实体的顺序进行排序,得到与所述药品文本对应的实体线性关系。4.根据权利要求3所述的方法,其中,所述医药关键实体包括:疾病名、药品名;所述医药非关键实体包括:人群、剂量、频次、疗程、给药途径、给药时机。5.根据权利要求1所述方法,其中,所述实体包括:前置条件实体、用法用量实体,所述前置条件实体包括:所述医药关键实体;所述根据对所述实体线性关系进行句法解析得到的解析结果,生成药品知识图谱,包括:基于识别所述实体线性关系所得到的前置条件实体,得到前置条件合并结果;基于识别所述实体线性关系所得到的用法用量实体,得到用法用量合并结果;基于所述实体线性关系中的各个前置条件实体与各个用法用量实体之间的位置关系,组合所述前置条件合并结果与所述用法用量合并结果,得到以所述前置条件合并结果中的至少一个元素与所述用法用量合并结果中的至少一个元素为集合元素的根节点集合;合并所述根节点集合中的所有不同集合元素;将所述根节点集合的合并结果中合并概率最高的合并结果作为解析结果,并将解析结果添加入知识图谱。6.根据权利要求5所述的方法,其中,所述基于识别所述实体线性关系所得到的前置条件实体,得到前置条件合并结果,包括:识别所述实体线性关系中的前置条件实体,将识别到的前置条件实体中的各个前置条件实体以及各个前置条件实体之间的组合,作为集合元素形成前置条件实体集合;将所述前置条件实体集合中的所有不同集合元素进行合并,得到前置条件合并结果。7.根据权利要求5所述的方法,其中,所述基于识别所述实体线性关系所得到的用法用量实体,得到用法用量合并结果,包括:识别所述实体线性关系中的用法用量实体,将识别到的用法用量实体中的各个用法用量实体以及各个用法用量实体之间的组合,作为集合元素形成用法用量实体集合;将所述用法用量实体集合中的所有不同集合元素进行合并,得到用法用量合并结果。8.根据权利要求1-7之一所述的方法,还包括:2CN112307216A权利要求书2/2页识别所述药品文本中所述实体的属性;将所述实体的属性添加至所述药品知识图谱中。9.根据权利要求1-7之一所述的方法,还包括:对所述药品文本进行以下至少一项格式化处理:对所述药品文本中表征相同意义的不同标点符号进行归一化处理;将所述药品文本中的中文数字转换为阿拉伯数字。10.一种药品知识图谱的构建装置,所述装置包括:识别单元,被配置成识别所述药品文本中的实体,替换单元,被配置成采用符合预设规则的字符串,替换所述实体中的医药关键实体,得到替换文本;还原单元,被配置成将基于所述替换文本所确定的分词结果中的所述字符串,还原为被所述字符串所替换的所述医药关键实体;成形单元,被