预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108647236A(43)申请公布日2018.10.12(21)申请号201810288330.3(22)申请日2018.03.30(71)申请人山东管理学院地址250000山东省济南市桑园路60号(72)发明人袁锋陈阳陈守强赵丽丽常晓玮(74)专利代理机构济南圣达知识产权代理有限公司37221代理人杨哲(51)Int.Cl.G06F17/30(2006.01)G06F17/27(2006.01)权利要求书1页说明书7页附图1页(54)发明名称一种基于词共现的中药处方向量空间模型方法及装置(57)摘要本发明公开了一种基于词共现的中药处方向量空间模型方法及装置,该方法包括:预处理中药处方数据,保留药方与相应证型对应关系,构建药方事务集;扫描整个药方事务集,计算各个中药频率以及药对的词共现频率,并根据此计算药对词共现的支持度和置信度;当药对词共现的支持度和置信度大于对应预设阈值时,将该药对加入共现词集合,直至遍历事务集;将共现词集合中属于中药处方药对库的药对构建语义向量空间模型。本发明有效表示中药处方潜在语义信息,从而提高中药处方聚类效果。CN108647236ACN108647236A权利要求书1/1页1.一种基于词共现的中药处方向量空间模型方法,其特征在于,该方法包括:预处理中药处方数据,保留药方与相应证型对应关系,构建药方事务集;扫描整个药方事务集,计算各个中药频率以及药对的词共现频率,并根据此计算药对词共现的支持度和置信度;当药对词共现的支持度和置信度大于对应预设阈值时,将该药对加入共现词集合,直至遍历事务集;将共现词集合中属于中药处方药对库的药对构建语义向量空间模型。2.如权利要求1所述的方法,其特征在于,所述预处理中药处方数据包括:对中药处方数据中的同义词、近义词和错别字进行修订。3.如权利要求1所述的方法,其特征在于,在本方法中,根据预处理中药处方数据中药方与相应证型对应关系,构建中药方剂药对,并根据中药方剂药对构建药方事务集。4.如权利要求1所述的方法,其特征在于,在本方法中,分别计算药方事务集中各个中药方剂药对的词共现频率以及中药方剂药对中单个中药的出现频率。5.如权利要求1所述的方法,其特征在于,在本方法中,所述药对词共现的支持度为药对在整个事务集中共同出现频率。6.如权利要求1所述的方法,其特征在于,在本方法中,所述药对词共现的置信度为药对的词共现频率的平方与中药方剂药对中单个中药的出现频率乘积的比。7.如权利要求1所述的方法,其特征在于,在本方法中,构建所述共现词集合的具体方法为:分别判断药对词共现的支持度和置信度与其对应预设阈值的大小关系;当药对词共现的支持度和置信度大于对应预设阈值时,将该药对加入共现词集合;否则,继续遍历事务集;直至整个药方事务集遍历完毕;构建共现词集合。8.如权利要求1所述的方法,其特征在于,在本方法中,将共现词集合中属于中药处方药对库的药对构建语义向量空间模型的具体方法为:将共现词集合中的共现词与中药处方药对库的药对进行比对;若共现词集合中的共现词属于中药处方药对库,则将药对的修正权值置1,否则置0;根据药对的修正权值、置信度、频率和逆文本频率的函数计算共现词的权值,并根据共现词权值,构建语义向量空间模型。9.一种计算机可读存储介质,其中存储有多条指令,其特征在于,所述指令适于由终端设备设备的处理器加载并执行根据权利要求1-8中任一项所述的方法。10.一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,其特征在于,所述指令用于执行根据权利要求1-8中任一项所述的方法。2CN108647236A说明书1/7页一种基于词共现的中药处方向量空间模型方法及装置技术领域[0001]本发明属于中药处方聚类的技术领域,尤其是涉及一种基于词共现的中药处方向量空间模型方法及装置。背景技术[0002]中医文献作为中医学的主要知识资源,信息量非常庞大,文献工作者们在进行研究时,往往需要人工对这些资料进行收集、分类、加工、检索、统计和推理,劳动强度大,效率低。计算机技术的发展给中医文献研究提供了新思路和新方法。利用计算机技术来辅助人们完成对中医文献的部分整理工作,将能在很大程度减轻人们的负担,更好的促进中医药的研究和发展。[0003]中医药信息的数字化工作开始于20世纪80年代,经过二十多年的发展已经取得了初步的成果。到目前为止已经有数十个中医药大学、学院及研究所建设了各种规模不同的中医药信息数据库近百个,初步实现了中医药信息数字化。现有的中药处方数据库的存在的主要不足是:对中药处方的核心信息处方中的药物及其用量信息没有细化,这给方剂数据的进一步利用造成了很大困难。目前专门讨