预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114255830A(43)申请公布日2022.03.29(21)申请号202111576268.6(22)申请日2021.12.21(71)申请人中国人民解放军国防科技大学地址410003湖南省长沙市开福区德雅路109号(72)发明人孙建彬王小燕赵青松赵蕊蕊游雅倩张涛杨克巍姜江葛冰峰(74)专利代理机构北京风雅颂专利代理有限公司11403代理人曾志鹏(51)Int.Cl.G16H10/00(2018.01)G06K9/62(2022.01)权利要求书3页说明书14页附图3页(54)发明名称基于规则分类器的增量医疗数据的分类方法及相关设备(57)摘要本申请提供一种基于规则分类器的增量医疗数据的分类方法及相关设备;包括:对医疗数据集预设多个类别,并确定医疗数据集中每个样本具备的属性和类别;确定对每个类别执行分类时的分类顺序;在每次分类中,计算每个该属性的属性可靠性,并得到可靠性排序;根据可靠性排序选择预定数量的属性作为初始特征子集,并构建规则分类器,利用规则分类器对样本进行分类,得到分类准确率;根据可靠性排序和分类准确率调整初始特征子集中的属性,得到目标特征子集;根据分类顺序,进行全部类别的分类,得到每次分类操作的目标特征子集和规则分类器;集成全部目标特征子集和规则分类器,用于对医疗数据集中的新样本进行分类。CN114255830ACN114255830A权利要求书1/3页1.一种基于规则分类器的增量医疗数据的分类方法,其特征在于,应用于存储有医疗数据集的数据库,包括:对医疗数据集预设多个类别,并确定所述医疗数据集中每个样本具备的多个属性和每个所述样本初始所隶属的类别;在全部所述类别中确定对每个所述类别执行分类时的分类顺序;在每次针对单个所述类别的分类中,对于每个所述属性,根据单独使用该属性进行分类时每个所述类别中所述样本的数量计算关于该属性的属性可靠性,根据全部所述属性可靠性得到可靠性排序;根据所述可靠性排序从全部所述属性中选择预定数量的所述属性作为初始特征子集,利用所述初始特征子集构建所述规则分类器,并利用所述规则分类器对全部所述样本进行分类,得到关于所述初始特征子集的分类准确率;根据所述可靠性排序和所述分类准确率调整所述初始特征子集中的所述属性,得到目标特征子集;根据所述分类顺序,进行全部所述类别的分类,得到每次分类操作的所述目标特征子集和所述规则分类器;集成全部所述目标特征子集和所述规则分类器,用于对所述医疗数据集中的新样本进行分类。2.根据权利要求1所述的方法,其特征在于,所述在每次针对单个所述类别的分类中,对于每个所述属性,根据单独使用该属性进行分类时每个所述类别中所述样本的数量计算关于该属性的属性可靠性,根据全部所述属性可靠性得到可靠性排序,包括:在每次针对单个所述类别的分类中,执行关于该类别,和非该类别的二分类操作;对于每个所述属性,在单独通过该属性对全部所述样本进行分类时,在每个所述类别中确定通过该属性判定属于该类别的所述样本的判定数量;根据该属性的所述判定数量确定该属性的所述属性可靠性;根据每个所述属性各自的所述属性可靠性,将全部所述属性按照所述属性可靠性从高到底的顺序进行排列。3.根据权利要求2所述的方法,其特征在于,所述利用所述初始特征子集构建所述规则分类器,包括:对于所述初始特征子集的每个所述属性,为该属性匹配多个参考值,并为每个所述参考值赋予对应的参考证据,为每个所述参考证据赋予对应的参考证据权重;对于所述初始特征子集的每个所述属性,根据该属性和该属性对应的所述参考值,构成在该属性与所述二分类操作中的两个所述类别之间的相似度分布,根据所述相似度分布构建该属性的参考证据矩阵;对于每个所述属性,根据在该属性上的所述相似度分布和所述参考证据矩阵,对该属性的所述参考证据进行加权,得到该属性的属性证据,并对该属性的所述参考证据的所述参考证据权重进行加权,得到该属性的属性证据权重,利用所述可靠性和所述属性证据权重对全部所述属性证据进行融合,得到所述规则分类器。4.根据权利要求1至3任一项所述的方法,其特征在于,根据所述可靠性排序和所述分类准确率调整所述初始特征子集中的所述属性,得到目标特征子集,包括:在未加入所述初始特征子集的所述属性中,选择所述可靠性排序最靠前的一个所述属2CN114255830A权利要求书2/3页性,加入到所述初始特征子集;基于构建的所述规则分类器,利用所述初始特征子集中的全部所述属性对全部所述样本进行分类;基于分类结果,计算关于该所述初始特征子集的所述分类准确率;根据所述分类准确率的数值变化,调整所述初始特征子集中的所述属性;将调整后的所述初始特征子集作为所述目标特征子集。5.根据权利要求4所述的方法,其特征在于,