预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107133496A(43)申请公布日2017.09.05(21)申请号201710355356.0(22)申请日2017.05.19(71)申请人浙江工业大学地址310014浙江省杭州市下城区潮王路18号浙江工业大学(72)发明人陈晋音郑海斌熊晖吴洋洋李南应时彦(74)专利代理机构杭州斯可睿专利事务所有限公司33241代理人王利强(51)Int.Cl.G06F19/24(2011.01)G06K9/62(2006.01)G06N3/04(2006.01)权利要求书2页说明书6页附图1页(54)发明名称基于流形学习与闭环深度卷积双网络模型的基因特征提取方法(57)摘要一种基于流形学习与闭环深度卷积双网络模型的基因特征提取方法,包括以下步骤:第一步,基于流形学习的癌症关联基因特征粗提取,第二步,基于闭环深度卷积双网络结构的基因特征精细提取,过程如下:采用正向卷积神经网络和反向卷积神经网络相结合的双网络结构,利用卷积神经网络的特征提取能力对基因表达数据集进行深度抽象,最终投影出关键特征;反向卷积神经网络实现关键特征的逆投影。本发明提供一种最大程度保留基因特征并实现快速降维的基于流形学习与闭环深度卷积双网络模型的基因特征提取方法。CN107133496ACN107133496A权利要求书1/2页1.一种基于流形学习与闭环深度卷积双网络模型的基因特征提取方法,其特征在于:所述提取方法包括以下步骤:第一步,基于流形学习的癌症关联基因特征粗提取,过程如下:1.1运用自适应密度聚类算法对基因表达数据做初始聚类处理,实现聚类中心的自动确定,对于聚类完成的每个类在类内降维为线性模型;1.2建立局部线性模型间的最小穿越树MST,将每个小线性模型根据它的聚类中心构成一个树的框架,采用其聚类中心作为线性模型代表,将所有聚类中心建立一个MST树,不断迭代相邻两个线性模型映射到同一线性模型构建遍历的骨架;1.3遍历流形的全局MST,沿着MST的框架将一个线性模型映射到另一个线性模型上,把已遍历过的映射合并为整块的线性模型映射到新的线性模型的方向上,最终流形形成在高维空间中的低维表示;1.4通过在全局超线性模型上运行独立分量分析ICA,再对高维空间的低维线性模型降维,将低维线性模型在低维空间中显示;第二步,基于闭环深度卷积双网络结构的基因特征精细提取,过程如下:采用正向卷积神经网络和反向卷积神经网络相结合的双网络结构,利用卷积神经网络的特征提取能力对基因表达数据集进行深度抽象,最终投影出关键特征;反向卷积神经网络实现关键特征的逆投影。2.如权利要求1所述的一种基于流形学习与闭环深度卷积双网络模型的基因特征提取方法,其特征在于:所述第二步中,将网络内部的线性过滤核替换为RBF核函数,通过设置RBF的超参数实现对CNN卷积运算的调控。3.如权利要求1或2所述的一种基于流形学习与闭环深度卷积双网络模型的基因特征提取方法,其特征在于:所述第一步中,对于高维样本基因数据M,M含有P个检测对象,每一个对象p为一个人所检测的N维基因序列,目标是找到N维流形中流形为M的n维内在结构的样本,n<<N。首先,对流形M中的数据对象运用自适应密度聚类算法进行聚类,按基因序列近似程度对所有样本划分。其次,建立局部线性模型间的最小穿越树MST,将拓扑结构中有序排列的这些线性模型用高维空间数据构造一个低维的全局流形,通过构造一个最小跨越树穿越超平面中心实现。4.如权利要求1或2所述的一种基于流形学习与闭环深度卷积双网络模型的基因特征提取方法,其特征在于:基因特征粗提取的过程如下:(a)计算n×n的矩阵D(i,j)=d(xi,xj),其中d是xi、xj间距离;(b)构造MST的矩阵S={Dnew},S是通过减去连边值判断三个节点之间是否成环来删除连边d,遵循使MST连边权重最小原则;(c)若已对所有节点组合可能判断成环,输出矩阵S,此时,聚类中心a可以看成MST的一个节点a,而节点之间的连线则为MST的树枝;再次,遍历流形的全局MST,即通过沿着超线性模型的MST遍历,并合并该超线性模型。5.如权利要求4所述的一种基于流形学习与闭环深度卷积双网络模型的基因特征提取方法,其特征在于:所述步骤(c)中,遍历的是聚类中心构成的MST节点,映射时应对节点所在的线性模型的每一个数据点进行操作。6.如权利要求4所述的一种基于流形学习与闭环深度卷积双网络模型的基因特征提取2CN107133496A权利要求书2/2页方法,其特征在于:所述步骤(c)中,在遍历过程中存在前向映射和返回映射,所述前向映射过程为:当从一个线性模型Ppre到另一个线性模型Pnew时,若新的线性模型Pnew还没被遍历过,将之前访问Ppre的映射到这个线性