预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115910203A(43)申请公布日2023.04.04(21)申请号202210726322.9(22)申请日2022.06.24(71)申请人山东大学地址250101山东省济南市高新区舜华路1500号(72)发明人王峻陈希余国先刘宁何伟(74)专利代理机构济南圣达知识产权代理有限公司37221专利代理师祖之强(51)Int.Cl.G16B20/50(2019.01)G16B20/30(2019.01)G16B40/00(2019.01)G16B5/00(2019.01)权利要求书3页说明书13页附图1页(54)发明名称基于属性异质网络嵌入的癌症协同驱动通路识别系统(57)摘要本发明提供了一种基于属性异质网络嵌入的癌症协同驱动通路识别系统,整合突变数据,进行数据对齐和初步筛选;获得基因权重,优化基因通路关系;构建属性异质网络,重构通路交互网络;定义通路间的协同驱动能力判定协同驱动通路。本发明使用基于通路结构的基因权重对基因通路间的关系进行优化,重要基因可以对识别驱动通路产生更大的贡献,降低无关基因对结果的干扰;使用属性异质网络嵌入为通路水平分析提供了其他生物学分子相关的丰富遗传信息,弥补了通路水平相关生物学信息不充分/缺失的问题;定义的通路间协同驱动能力综合考虑了协同驱动通路的高覆盖性、高互斥性、突变共现和功能关联,能高效准确的识别协同驱动通路。CN115910203ACN115910203A权利要求书1/3页1.一种基于属性异质网络嵌入的癌症协同驱动通路识别系统,其特征在于:包括:数据预处理模块,被配置为:整合拷贝数变异数据和单核苷酸多态性数据为突变数据,并在多组学属性异质数据上进行数据对齐和初步筛选,获得可用的异质数据;基因权重获取模块,被配置为:根据通路内部网络结构得到不同通路中基因的网络权重,并根据权重优化基因通路交互网络;属性异质网络嵌入模块,被配置为:根据收集到的多种生物学分子和通路对应的属性数据与关系数据构建初始的属性异质网络,通过收集的所研究癌症相关的miRNA以及优化的基因通路交互网络对初始属性异质网络进行优化,基于联合矩阵分解的嵌入框架集成异质数据,对优化后的属性异质网络进行嵌入,补充不完整的通路间关系,重构通路交互网络;协同驱动通路识别模块,被配置为:使用优化的基因通路交互网络得到对应每条通路的突变数据;依据驱动通路在突变数据上的高覆盖性和高互斥性定义单独驱动通路的驱动能力;依据重构的通路交互网络和突变共现定义通路间的协同驱动能力;结合通路的驱动能力和通路间的协同驱动能力定义综合驱动权重,在重构的通路交互网络上识别协同驱动通路。2.如权利要求1所述的基于属性异质网络嵌入的癌症协同驱动通路识别系统,其特征在于:拷贝数变异数据为:患者的拷贝数变异数据,数据为多维,每一维对应患者的一个基因位点,当发生拷贝数重复或缺失时该基因数据为1,拷贝数正常为0。3.如权利要求1所述的基于属性异质网络嵌入的癌症协同驱动通路识别系统,其特征在于:单核苷酸多态性数据为:患者的单核苷酸多态性数据,数据为多维,每一维对应患者的一个基因位点,当发生单核苷酸多态时该基因数据为1,未发生单核苷酸多态时为0。4.如权利要求1所述的基于属性异质网络嵌入的癌症协同驱动通路识别系统,其特征在于:异质数据包括:拷贝数变异数据和单核苷酸多态性数据,还包括:分为不同癌症亚型的单细胞基因表达数据,数据为多维,每一维对应不同亚型患者的一个基因位点,其值代表该基因的表达水平;基因交互网络,数据为多维,每一维对应一个基因,其值描述基因间共同参与信号传递、能量和物质代谢及细胞周期调控的相互作用强度。5.如权利要求1所述的基于属性异质网络嵌入的癌症协同驱动通路识别系统,其特征在于:整合拷贝数变异数据和单核苷酸多态性数据为突变数据,在多组学数据上进行基因对齐和初步筛选,包括:获取拷贝数变异数据和单核苷酸多态性数据,根据基因在批量样本上的突变情况整合拷贝数变异数据和单核苷酸多态性数据构建突变数据,当基因发生拷贝数变异或出现单核苷酸多态性时,对应突变数据的值为1;基于此前获得的突变数据,基于基因的突变频率和患者的实际情况数据,选择综合突变频率靠前的预设个数的基因。2CN115910203A权利要求书2/3页6.如权利要求1所述的基于属性异质网络嵌入的癌症协同驱动通路识别系统,其特征在于:根据通路内部网络结构得到不同通路中基因的网络权重,并根据权重优化基因通路交互网络,包括:使用基因在通路内部有向图结构中的拓扑次序和度定义基因在通路上的网络权重,拓扑次序越靠前和度的值越高的基因具有更大的网络权重;根据该网络权重对优化了基因通路关系,通过最小最大归一化方法对加权的基因通路交互网络进行了标准化。7.如权利要求