预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113707323A(43)申请公布日2021.11.26(21)申请号202111017462.0G06N20/00(2019.01)(22)申请日2021.08.31(71)申请人平安科技(深圳)有限公司地址518000广东省深圳市福田街道福安社区益田路5033号平安金融中心23楼(72)发明人徐衔(74)专利代理机构北京中强智尚知识产权代理有限公司11448代理人贾依娇(51)Int.Cl.G16H50/30(2018.01)G06Q10/04(2012.01)G06K9/46(2006.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书12页附图4页(54)发明名称基于机器学习的疾病预测方法、装置、设备及介质(57)摘要本发明涉及人工智能技术领域,揭露一种基于机器学习的疾病预测方法,包括:针对预先收集的用户病例数据进行结构化处理,得到病例样本数据;将病例样本数据输入至神经网络模型中进行训练,得到疾病特征向量、记忆向量以及距离值;在训练过程中,利用距离值不断调整疾病特征向量与记忆向量的比例参数,并根据比例参数所确定用户在各个疾病类别上的特征向量,构建疾病预测模型;响应于疾病预测指令的触发,利用疾病预测模型对目标用户病例数据进行预测,输出目标用户在各个疾病类别上的概率。本发明能够在面向不平衡样本数据的情况,通过在模型训练过程中将多数类样本中学习到的知识迁移到少数类样本的预测中,提高疾病预测结果的准确率。CN113707323ACN113707323A权利要求书1/2页1.一种基于机器学习的疾病预测方法,其特征在于,所述方法包括:针对预先收集的用户病例数据进行结构化处理,得到病例样本数据;将所述病例样本数据输入至神经网络模型中进行训练,得到疾病特征向量、记忆向量以及距离值;在训练过程中,根据所述疾病特征向量、记忆向量以及距离值确定用户在各个疾病类别上的特征向量,构建疾病预测模型;响应于疾病预测指令的触发,利用所述疾病预测模型对目标用户病例数据进行预测,输出目标用户在各个疾病类别上的概率。2.根据权利要求1所述的方法,其特征在于,所述针对预先收集的用户病例数据进行结构化处理,得到病例样本数据,具体包括:针对医疗平台定时收集不同表达形式的用户病例数据,利用预设的疾病属性字段从所述用户病例数据中提取与疾病类别关联的病例数据,所述疾病属性字段为针对疾病类别设置的关键词;按照固定的语法规范对所述与疾病类别关联的病例数据进行信息抽取,得到疾病样本数据。3.根据权利要求1所述的方法,其特征在于,所述神经网络模型为多层网络结构,至少包括特征提取层和记忆区块,所述将所述病例样本数据输入至神经网络模型中进行训练,得到疾病特征向量、记忆向量以及距离值,具体包括:将所述疾病样本数据输入至神经网络模型中进行训练,并选取特征提取层输出的疾病特征向量;以所述疾病特征向量作为所述记忆区块的输入,在所述记忆区块中计算各个疾病类别在特征空间的中心向量以及疾病类别的记忆向量;计算所述疾病特征向量到所述各个疾病类别在特征空间的中心向量之间的距离值。4.根据权利要求3所述的方法,其特征在于,所述以所述疾病特征向量作为所述记忆区块的输入,在所述记忆区块中计算各个疾病类别在特征空间的中心向量以及疾病类别的记忆向量,具体包括:在所述记忆区块中输入所述疾病特征向量,并根据所述疾病特征向量计算各个疾病类别在特征空间的中心向量,作为记忆区块中各个疾病类别的初始化;针对所述记忆区块中的模型参数进行训练,并根据所述疾病特征向量、训练的权重参数以及各个疾病类别在特征空间的中心向量,计算疾病类别的记忆向量。5.根据权利要求1所述的方法,其特征在于,所述在训练过程中,根据所述疾病特征向量、记忆向量以及距离值确定用户在各个疾病类别上的特征向量,构建疾病预测模型,具体包括:在训练过程中,利用所述距离值所反映疾病特征在疾病类别上的学习能力不断调整所述疾病特征向量与所述记忆向量之间的比例参数;根据所述比例参数确定用户在各个疾病类别上的特征向量,构建疾病预测模型。6.根据权利要求5所述的方法,其特征在于,所述利用所述距离值所反映疾病特征在各个疾病类别的学习能力不断调整所述疾病特征向量与所述记忆向量之间的比例参数,具体包括:2CN113707323A权利要求书2/2页若所述距离值所反映疾病特征在各个疾病类别上的预测值小于预设数值,则从所述记忆区块中迁移第一预设数量的记忆向量对进行学习,以调低所述疾病特征向量与所述记忆向量之间的比例参数;若所述距离值所反映疾病特征在预设疾病类别上的预测值大于预设数值,则从所述记忆区块中迁移第二预设数量的记忆向量对进行学习,以调高所述疾病特征向量与所