预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113656588A(43)申请公布日2021.11.16(21)申请号202111019709.2(22)申请日2021.09.01(71)申请人平安医疗健康管理股份有限公司地址200000上海市黄浦区北京东路666号H区(东座)12G室(72)发明人黎安(74)专利代理机构深圳市明日今典知识产权代理事务所(普通合伙)44343代理人王杰辉(51)Int.Cl.G06F16/35(2019.01)G06F16/33(2019.01)G06F16/36(2019.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书3页说明书16页附图3页(54)发明名称基于知识图谱的数据对码方法、装置、设备和存储介质(57)摘要本申请涉及人工智能技术领域,提供一种基于知识图谱的数据对码方法、装置、计算机设备和存储介质,方法包括:获取医疗清单数据;将项目数据输入目标文本分类模型,获取与项目数据对应的文本分类结果;若文本分类结果属于医保目录分类结果,从知识图谱查找与文本分类结果对应的类别节点;对项目数据进行预处理得到关键词;从知识图谱中获取与类别节点对应的多条第一链路,从所有第一链路中确定出与所有关键词匹配的目标链路;获取与目标链路对应的目标医疗编码;将目标医疗编码作为项目数据的对码结果。本申请能够准确实现对于医疗清单数据中的项目数据的对码处理。本申请还可以应用于区块链领域,上对码结果等数据可以存储于区块链上。CN113656588ACN113656588A权利要求书1/3页1.一种基于知识图谱的数据对码方法,其特征在于,包括:获取待处理的医疗清单数据;其中,所述医疗清单数据包括项目数据;将所述项目数据输入至预设的目标文本分类模型,获取所述目标文本分类模型输出的与所述项目数据对应的文本分类结果;判断所述文本分类结果是否属于预设的医保目录分类结果;若是,从预设的知识图谱中查找出与所述文本分类结果对应的类别节点;对所述项目数据进行文本预处理得到对应的关键词;其中,所述关键词的数量包括多个;从所述知识图谱中获取与所述类别节点对应的多条第一链路,并基于所述关键词对所有所述第一链路进行匹配处理,从所有所述第一链路中确定出与所有所述关键词匹配的目标链路;获取与所述目标链路对应的目标医疗编码;将所述目标医疗编码作为所述项目数据的对码结果。2.根据权利要求1所述的基于知识图谱的数据对码方法,其特征在于,所述将所述项目数据输入至预设的目标文本分类模型,获取所述目标文本分类模型输出的与所述项目数据对应的文本分类结果的步骤之前,包括:调用预先训练好的预设数量的文本分类模型;其中,每一个所述文本分类模型是基于各自不同的训练样本集对预设的初始文本分类模型进行训练生成的,所述训练样本集的数量等于所述预设数量;基于预设的验证样本集生成各所述文本分类模型的分类准确度;获取预设的分类准确度阈值,从所有所述文本分类模型中筛选出分类准确度大于所述准确度阈值的第一文本分类模型;基于所述验证样本集生成各所述第一文本分类模型的模型处理时间;获取与所述分类准确度对应的第一权重,以及获取与所述模型处理时间对应的第二权重;基于各所述第一文本分类模型的分类准确度、所述模型处理时间、所述第一权重与所述第二权重,计算生成各所述第一文本分类模型的评测得分;从所有所述第一文本分类模型中筛选出评测得分最高的第二文本分类模型;将所述第二文本分类模型作为所述目标文本分类模型。3.根据权利要求2所述的基于知识图谱的数据对码方法,其特征在于,所述基于预设的验证样本集生成各所述文本分类模型的分类准确度的步骤,包括:获取所述验证样本集;其中,所述验证数据集包括多个验证数据,以及与各所述验证数据分别对应的类别信息;分别将各所述验证数据输入至第三文本分类模型中,获取所述第三文本分类模型输出的与各所述验证数据分别对应的第一分类结果;其中,所述第三文本分类模型为所有所述文本分类模型中的任意一个模型;基于与各所述验证数据分别对应的类别信息,获取所有所述第一分类结果中预测正确的第二分类结果;获取所述第一分类结果的第一数量,以及获取所述第二分类结果的第二数量;2CN113656588A权利要求书2/3页计算所述第二数量与所述第一数量的第一商值;将所述第一商值作为所述第三文本分类模型的分类准确度。4.根据权利要求2所述的基于知识图谱的数据对码方法,其特征在于,所述基于所述验证样本集生成各所述第一文本分类模型的模型处理时间的步骤,包括:获取所述验证样本集;其中,所述验证数据集包括多个验证数据,以及与各所述验证数据分别对应的类别信息;在第四文本分类模型获取到每一个所述验证数据时,分别统计所述第四文本分类模型输出与每一个所述验证数据