预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110310707A(43)申请公布日2019.10.08(21)申请号201910610392.6(22)申请日2019.07.08(71)申请人西北工业大学地址710072陕西省西安市友谊西路127号(72)发明人彭佳杰卢俊雅王晓昱尚学群(74)专利代理机构西北工业大学专利中心61204代理人王鲜凯(51)Int.Cl.G16B45/00(2019.01)G16B50/10(2019.01)G16B40/00(2019.01)G16B20/50(2019.01)权利要求书3页说明书7页附图3页(54)发明名称基于时序数据的表型本体构建方法(57)摘要本发明公开了一种基于时序数据的表型本体构建方法,用于解决现有表型本体构建方法实用性差的技术问题。技术方案是通过基因之间的相互作用关系自动识别并捕获瞬时表型,通过捕捉瞬时表型之间的关系,构建一个有向无环图,最终得到表型本体。本发明绕植物表型本体展开,通过基因、表型和环境之间的关系,构建出植物的时序表型本体。该方法基于图论挖掘植物时序表型数据中的潜在模式,算法易于实现,时间复杂度低,能够在有限的时间复杂度和空间复杂度内完成本体构建。其构建出来的表型本体拥有完善的拓扑结构,是一个注释了生物信息的有向无环图。节点之间的关系被很好的保留,节点的生物信息和生物意义也被很好的注释,实用性好。CN110310707ACN110310707A权利要求书1/3页1.一种基于时序数据的表型本体构建方法,其特征在于包括以下步骤:步骤一、获取实验数据;动态环境光合成像集成多个组件的实验平台,在动态环境条件下连续监测植物的生长和光合作用;实验中每个突变体为敲除特定基因的拟南芥植株,在动态环境下对其光合作用的参数和叶片的生长情况进行数天的监测,最终得到拟南芥的光合作用时序表型数据;基于DEPI技术测量得到初始表型数据,使用记录的倍数变化将每个基因的表型值与参考值进行比较,得到相对表型值;参考值是野生型突变体实验,重组近交系实验中的亲本系,或者是群体实验中所有个体的平均值;步骤二、表型相关性的计算;给定时序表型数据M(P,T),Ti是一个时间窗口,Ti∈T;P是一个基因集合,集合中的每个基因Pj代表敲除该基因的一个突变体;首先将时间序列T切割为m个长度为n的时间窗口;一个表型术语的最小注释时间长度为一个时间窗口的大小,时间窗口内的时间点是连续的;然后针对每一个时间窗口Ti,构造一个无向图Gi(S,Ei),S是基因集合,Ei为无向图中的边,表示在时间窗口Ti内两个基因具有相似的表型值;对于每一个时间窗口Ti均使用NPM聚类方法进行多次聚类,通过统计任意两个基因被聚在同一类的频数,计算出这两个基因的表型相关性;对于基因gi和基因gj,在n次试验中,被聚在同一类的次数为k,则表型相关性为:计算出来的值越大,表示该基因对拥有更为相似的表型值;步骤三、动态表型网络构建;初始化各个时刻下的表型网络是散点图;根据计算得到的基因的表型相关性,将表型相关性值满足给定阈值的基因对进行连接操作;当两个基因的表型相关性大于给定的阈值时,将在无向图内增加一条边连接这两个基因;通过不断的连接,构造每一个时间窗口下的无向图;由步骤二计算得到的基因表型相关性初步得到T={T1,T2,T3},P={A,B,C,D,E,F,G};初始化各个基因结点为孤立的节点;当表型相关性阈值设定为0.8时,在时间窗口T1下,满足阈值要求的基因对有:(A,B),(A,C)(A,D),(B,C),(B,D),(C,D),(D,E),(D,F),(D,G),(E,F),(F,G),因此分别对这些基因之间进行连边操作,生成时间窗口T1下的无向图G1;在时间窗口T2下,满足阈值要求的有9组基因对:(A,B),(A,C),(A,E),(B,C),(B,E),(C,E),(C,F),(E,F),(F,G),分别对这些基因之间进行连边操作,生成时间窗口T2下的无向图G2;在时间窗口T3下,表型相关性满足给定阈值要求的一共有8组基因对,这8组基因对分别为:(A,C),(A,G),(C,E),(C,F),(C,G),(E,F),(E,G),(F,G),分别对这些基因对之间进行连边操作,生成时间窗口T3下对应的无向图G3;对每一个无向图,使用改进版本的Bron-Kerbosch算法查找出对应的极大团;对无向图G1,通过极大团算法搜寻得到三个极大团,这三个极大团分别为C1,1={A,B,C,D},C1,2={D,E,F},C1,3={D,F,G};对无向图G2,得到四个极大团,分别为C2,1={C,E,F},C2,2={A,B,C,E},C2,3={G,F},C2,4={D};对无向图G3,得到四个极大团