预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112365943A(43)申请公布日2021.02.12(21)申请号202011136028.XG06N20/00(2019.01)(22)申请日2020.10.22(71)申请人杭州未名信科科技有限公司地址311200浙江省杭州市萧山区宁围街道钱江世纪公园C区1幢101室申请人浙江省北大信息技术高等研究院(72)发明人吴静依李鹏飞李青张路霞(74)专利代理机构北京辰权知识产权代理有限公司11619代理人刘广达(51)Int.Cl.G16H10/60(2018.01)G16H50/70(2018.01)G16H70/20(2018.01)G06K9/62(2006.01)权利要求书2页说明书8页附图5页(54)发明名称患者住院时长的预测方法、装置、电子设备及存储介质(57)摘要本申请公开了一种患者住院时长的预测方法、装置、电子设备及存储介质,该方法包括:利用多个二分类基学习器级联串接构建有序多分类的预测模型;利用训练数据集训练各个基学习器直至每一基学习器达到性能指标要求,得到训练好的预测模型;根据预设预测特征选取待预测样本输入训练好的预测模型,得到预测结果。本申请的方法利用多个二分类基学习器级联串接构建有序多分类的预测模型,保留了有序多分类结局变量中各个类别间的序列递进关系,且不假设有序类别间为等比关系,更符合真实数据特征,通过将数据集逐层拆分,使得用于各层基学习器训练的数据集中两个类别的数据相对平衡,有效解决多类别间数据不平衡的问题,提高了预测结果准确率。CN112365943ACN112365943A权利要求书1/2页1.一种患者住院时长的预测方法,其特征在于,包括:利用多个二分类基学习器级联串接构建有序多分类的预测模型;利用训练数据集训练各个所述基学习器直至每一所述基学习器达到性能指标要求,得到训练好的预测模型;根据预设预测特征,选取待预测样本输入所述训练好的预测模型,得到预测结果。2.根据权利要求1所述的方法,其特征在于,在所述利用训练数据集训练各个所述基学习器之前,所述预测方法还包括:基于医院信息管理系统中患者的电子病历数据,进行数据清理,提取训练数据构成训练数据集。3.根据权利要求2所述的方法,其特征在于,在所述根据预设预测特征,选取待预测样本输入所述训练好的预测模型之前,所述预测方法还包括:从所述医院信息管理系统的电子病历数据中或者从所述训练数据集中筛选出对患者的住院时长预测价值高的预测特征;结合专家知识对所筛选的预测特征进行补充与调整,得到预设预测特征。4.根据权利要求2所述的方法,其特征在于,所述进行数据清理,包括:剔除缺失率过高的患者数据,剔除异常数据,以及随机填补数据缺失值。5.根据权利要求1所述的方法,其特征在于,所述二分类基学习器为梯度提升决策树算法。6.根据权利要求1所述的方法,其特征在于,所述利用训练数据集训练各个所述二分类基学习器直至每一所述二分类基学习器达到性能指标要求,包括:S1、将所述训练数据集输入所述预测模型,设定初始值m=1;单个训练样本输入格式为(x,y);y为包含有序M分类的结局变量,x代表训练样本的预测特征的集合;M为所述预测模型的分类类别的数量;S2、判断m是否<M;若是,则进入步骤S3;若否,则跳到步骤S7;S3、提取y≥第m类别的数据作为第m个基学习器的训练数据子集;S4、用第一训练标签标记所述训练数据子集中y=第m类别的数据,用第二训练标签标记所述训练数据子集中y>第m类别的数据;S5、基于上述步骤获得的所述训练数据子集与训练标签,训练所述二分类基学习器,得到第m个基学习器;S6、m自增1后更新,返回步骤S2;S7、输出训练完成的M-1个基学习器。7.根据权利要求6所述的方法,其特征在于,采用随机超参数搜索结合五折交叉验证方法实现各个基学习器的超参数优化,使用F1分数作为超参数寻优的模型预测性能的参考指标。8.根据权利要求1所述的方法,其特征在于,所述预测方法还包括:基于医院信息管理系统中电子病历数据的更新,定期同步对所述预测模型进行更新。9.一种患者住院时长的预测装置,其特征在于,包括:构建模块,用于利用多个二分类基学习器级联串接构建有序多分类的预测模型;训练模块,用于利用训练数据集训练各个所述基学习器直至每一所述基学习器达到性2CN112365943A权利要求书2/2页能指标要求,得到训练好的预测模型;预测模块,用于根据预设预测特征,选取待预测样本输入所述训练好的预测模型,得到预测结果。10.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-8中任一所述的患者住院时长的预测方法。11.一种计算机