预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113921136A(43)申请公布日2022.01.11(21)申请号202111070025.5(22)申请日2021.09.13(71)申请人吾征智能技术(北京)有限公司地址100000北京市海淀区西三旗沁春家园1号楼、2号楼、3号楼3层301-3045室(72)发明人杜登斌杜小军杜乐(74)专利代理机构武汉红观专利代理事务所(普通合伙)42247代理人王昌亮(51)Int.Cl.G16H50/30(2018.01)G16H50/70(2018.01)G06K9/62(2022.01)权利要求书2页说明书5页附图2页(54)发明名称一种融合多源数据智能评估预测慢性病风险的系统(57)摘要本发明公开了一种融合多源数据智能评估预测慢性病风险的系统,包括以下几个模块:数据采集模块:获取多源数据;因素搜索模块:利用遍历查找慢性病致病的风险因素数据库以及知识库;风险映射模块:建立多源数据与慢性病致病的风险因素对应的映射关系模型,收集映射数据并作为映射数据集;数据训练验证模块:将映射数据集作为KNN分类器的输入,训练KNN分类器;数据评估预测模块:利用分类后的数据集建立比例风险回归模型,评估慢性病相对风险指标。本发明可以对不同来源间的关系进行危险度量化,并评估得到目标用户的慢性病相对风险指标,在目标用户数据稀缺的情况下,融合各方面信息和数据,提高了预测评估的精度置信下限和速度。CN113921136ACN113921136A权利要求书1/2页1.一种融合多源数据智能评估预测慢性病风险的系统,其特征在于:包括以下模块:数据采集模块,获取目标用户的多源数据;因素搜索模块,搜索慢性病致病的直接和间接风险因素数据库以及慢性病知识库,对数据库和知识库进行遍历查找,将搜索相关的数据作为慢性病致病的直接和间接的风险因素数据;风险映射模块,根据慢性病致病的直接和间接的风险因素数据,建立多源数据与慢性病致病的直接和间接风险因素对应的映射关系模型,根据所述映射关系模型收集映射数据,作为映射数据集;数据训练验证模块,将所述映射数据集作为改进的KNN分类器的输入,训练KNN分类器,直至其分类误差达到阈值;数据评估预测模块,根据分类后的数据集建立比例风险回归模型,用于评估目标用户的慢性病相对风险指标。2.如权利要求1所述的一种融合多源数据智能评估预测慢性病风险的系统,其特征在于:数据采集模块中,所述多源数据,包括但不限于,行为数据,包括基本信息、个人疾病史、家族疾病史、烟酒习惯、膳食习惯和睡眠习惯数据;生化指标数据,包括血常规、尿常规、便常规、肝功能数据、常规心电图、内科检查和外科检查数据。3.如权利要求1所述的一种融合多源数据智能评估预测慢性病风险的系统,其特征在于:因素搜索模块中,将搜索相关的数据作为慢性病致病的直接和间接的风险因素数据之后,对慢性病致病的直接和间接风险因素数据进行归一化处理。4.如权利要求3所述的一种融合多源数据智能评估预测慢性病风险的系统,其特征在于:所述慢性病致病的直接和间接风险因素数据包括但不限于,遗传因素、性别与年龄因素、从事职业因素、饮食习惯因素和体重超重因素。5.如权利要求1所述的一种融合多源数据智能评估预测慢性病风险的系统,其特征在于:数据训练验证模块中,所述训练KNN分类器,具体包括以下单元:距离计算单元,计算已知类别映射数据集中每个点和输入的待测点之间的距离;排序单元,按照距离递增顺序排序;选取单元,选取与输入的待测点距离最近的k个点;频率确定单元,确定前k个点所在类别出现的频率;预测分类单元,返回前k个点出现频率最高的类别作为输入的待测点的预测分类。6.如权利要求5所述的一种融合多源数据智能评估预测慢性病风险的系统,其特征在于:距离计算单元中,在计算已知类别映射数据集中每个点和输入的待测点之间的距离之前,利用斯皮尔曼等级相关将映射数据集中的同一疾病类别中的每两个映射数据进行相关度检测,保留相关度高于预设相关度阈值的多组映射数据,作为第一样本集,进行KNN分类;相关度低于预设相关度阈值的多组映射数据,作为第二样本集,进一步地进行KNN分类。7.如权利要求5所述的一种融合多源数据智能评估预测慢性病风险的系统,其特征在于:排序单元中,在按照距离递增顺序排序之前,对计算后每组映射数据点与点之间的距离进行加权,分为不同权重的每组映射数据。2CN113921136A权利要求书2/2页8.如权利要求6所述的一种融合多源数据智能评估预测慢性病风险的系统,其特征在于:选取单元中,在选取与输入的待测点距离最近的k个点之前,采用交叉验证法,求得第一样本集KNN分类后所对应的k值,并作为后续第二样本集进一步KNN分类的k取值。9.如权利要求1所述的一种融合多源数据