预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共32页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

7.91/7.36/BE.49 0 第四讲 2004.3.4 马尔柯夫及隐马尔柯夫模型 DNA序列分析 ChrisBurge 课程结构 课时主题模型结构相关 加权矩 完全独立 阵模型 隐马尔柯 局部相关 夫模型 能量模型,共 非局部相关 变模型 DNA的马尔柯夫及隐马尔柯夫模 型 剪接位点的马尔柯夫模型 隐马尔柯夫模型 ——在头巾下观看 威特比(Viterbi)演算法 真实世界中的隐马尔柯夫模型 DNA基序构建及发现简介 剪接位点的加权矩阵模型 (WMMs) 模体(motif)代表的信息 模体的寻找或发现问题 吉布斯采样法 模体构建——加权矩阵之上 DNA、RNA基序包含的信息 信息熵(shannon 信息entro/py位置) 随机序列中每2m个碱基将产生一个包含m比特信息 的模体 变量对发现基序的影响 L=序列平均长度 N=序列编码 I=模体包含的信息 W=模体宽度 怎样识别5’ss RNA热力学I 螺旋构型自由能来自于: 碱基配对: 碱基堆积: DougTurner’s能量规则: RNA热力学 很多连续碱基 对-好 内部环-坏 终端碱基对不 稳定-坏 总的来说,A比B、C更稳定 5’ss序列中的条件频率 5’ss在+5处含有5’ss在+5处没有 GG 数据来源:Burge,1998,分子生物学中的计算 方法 哪一种模型能够表现位置之 间的相互关系? 马尔柯夫模型 专业术语 随机变量(RV): 可以假定为任意一系列的值,其中每一个值都有 一定的出现可能性 例如:X=一个骰子滚动的结果 两个骰子的过程:X,X,X……连续骰子滚动 123 随机过程: 随意过程或是随机变量的序列 什么是马尔柯夫模型(aka马尔 柯夫链)? 传统定义 离散地随机过程X,X,X…… 123 它拥有马尔柯夫性质: 换句话来说就是: 它是一个随机过程,具有将来(下一个状态)有条件 地与过去存在(现在状态)相互独立的性质。 Markov–俄罗斯数学家,ca.1922 不同类的一阶马尔柯夫模型 马尔柯夫模型的估计参数 更长排列相关是什么? ——k顺序马尔柯夫模型 k顺序马尔柯夫模型大约有4k+1个参数或位 置 不同类 同类 人类5’ss序列的加权矩阵模型 (WMM)与马尔柯夫一阶模型比较 剪接模型I 5’剪接点 分枝位点 3’剪接点 剪接模型Ⅱ 过渡联合体 联合体交叉内含子外显子定义联合体 5‘剪接位点多嘧啶3’剪接位剪接体前体联合体 分枝点点序 列 剪接体 关于人类Pre-mRNA剪接的一个 新近模型 SR=SR蛋白质家族剪接因子成员ESE=外显剪接增强子 交叉外显交叉外显 交叉内含 ESEs是一些短模体,它提高了在所有构建和选择剪接 外显子中邻近剪接位点的识别能力—精确序列需求不能 很好地表现。 隐马尔柯夫模型 akaHMMs 马尔柯夫模型 序列比对 序列比对 序列比对的隐马 尔柯夫模型 配对状态插入状态删除状态转换可能性 马尔柯夫和隐马尔柯夫模型 CpG岛 CpG岛隐马尔柯夫模 型 CpG岛隐马尔柯夫模型Ⅱ CpG岛隐马尔柯夫模型Ⅲ 想推断 观测 但是HMM写在其它方向(依靠隐藏才 可见) 从可见的推断隐藏部分 (贝叶斯法则) 条件prob: P(A|B)=P(A,B)/P(B) 计算稍微有点困难 注意: 即 因此可视为常数 将 寻找最佳“分列” (viterbi算法) 寻找隐藏状态的顺序 连接概率最佳化: 序列最佳”分列“ 解决方案: 定义 R(h)=在以状态结束情况下,子序列 ih 1…i最佳分列的概率 递归解答,例如:根据()确定 R1h ()。 R2h Viterbi算法“格架”图表 序列中的位置 藏 隐 层 长度为L的序列k层隐马尔柯夫模型运行时间 HMMs的发 展 有用的HMMs 的发展