预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

德州学院物电学院2014届应用物理学专业毕业论文23基于序列特征的固有无序蛋白结合位点的统计分析xxx(物理与电子信息学院,山东德州253023)摘要本文以Disprot和BSDP数据库中的固有无序蛋白的结合位点为研究对象,构建9种结合位点数据集,利用MATLAB进行统计结合位点各种氨基酸的频率,结果发现,蛋白质与蛋白质相互作用的结合位点最多,蛋白质与ATP/GTP相互作用的结合位点最少,而且还可以得知各种类型结合位点的氨基酸具有明显的偏好性。该研究有助于认识固有无序蛋白质与其它成份的相互作用特征、为进一步挖掘固有无序蛋白质的序列特征,进而为发展预测固有无序蛋白质与蛋白质、DNA、RNA、配体、辅因子等物质结合位点的软件奠定了良好的基础。关键词固有无序蛋白;无序区;序列分析;结合位点1引言1.1固有无序蛋白质蛋白质是构成生物体最重要的两类大分子之一,蛋白质翻译在整个生物过程中发挥着非常重要的作用。传统思想认为,蛋白质要实现生物功能,必须先折叠成一个稳定的三维结构,因此形成了蛋白质结构决定其功能的主流观点,对蛋白质科学的研究已经取得了一系列成就,创造了现代蛋白质科学的“大爆炸”时代[1]。然而,随着基因工程方法和实验技术的发展以及基因组计划的开展,在上个世纪90年代初,人们发现有些蛋白质或蛋白质序列中的一部分区域在生理条件下不具有一个确定的三维结构,但依然能够正常行使生物学功能。后来发现,这类蛋白质越来越多,并逐渐形成了一种新的蛋白质类型,称为固有无序蛋白质[2,3,4](intrinsicallydisorderedproteins,简称为IDPs)。固有无序蛋白质的特征是整条链或链的一部分并不具有严格的三维结构,原子位置及主链二面角没有特定的平衡值而是随着时间发生很大的变化。经过十多年的研究,人们发现这类蛋白质在生物体内普遍存在而且十分丰富[5,6],可以位于细胞的不同部位。研究还发现,真核生物体中含有的固有无序蛋白质数量远远高于古细菌和细菌中的固有无序蛋白[7,8],即生物进化的一个重要特点是蛋白质中无序区的含量在增加。固有无序蛋白质概念的提出既是对蛋白质科学的挑战,也是科学研究的巨大机遇,为了深入认识固有无序蛋白质的性质,研究其序列特征、进化过程中结构的保守性以及功能等是十分重要的科学问题。1.2固有无序蛋白质的生物学功能无序蛋白质在生物体内是普遍存在的。例如利用预测算法DISOPRED2对古细菌细菌和真核生物的蛋白质组序列进行的分析表明,长度大于30个氨基酸的无序区域在这三个物种中的比例分别为2.0%、4.2%和33.0%[9]。对目前存在的大量基因库数据进行预测,分析蛋白质的结构无序与蛋白质功能之间的关联,通过这种方法人们发现无序蛋白质在诸如转录和翻译调控细胞信号转导蛋白磷酸化及小分子存储等过程中发挥着重要的作用;另一方面无序蛋白质又似乎给生物体系带来一些不利的影响,经常与多种疾病联系在一起。与人类癌症相关的蛋白质中有79%的蛋白质有无序片段;在心血管疾病有关的蛋白质中,无序蛋白质的含量也高达57%。DisProt数据库将所有固有无序蛋白质分为7大功能和1组未知功能,并且将这7种功能又细分为28种更具体的功能。按照Disprot数据库的功能划分方法,将此数据库中所有固有无序蛋白质分为以下8组:分子伴侣、熵链、金属吸附器、位点修饰、分子组装、分子识别效应器、分子识别抗氧剂和未知功能。1.3固有无序蛋白质的序列氨基酸(Aminoacid)是构成蛋白质的基本单位,赋予蛋白质特定的分子结构形态,使它的分子具有生化活性。固有无序蛋白质可以指整个蛋白质在生理环境下缺乏稳定的结构,也可以指蛋白质中的一部分区域没有结构,这部分区域通常称为无序区。这类蛋白质在氨基酸序列上具有显著的特征。其中最显著的特征是它们的疏水残基含量较低,同时拥有较高的未被中和的电荷因此不能形成一个稳定的疏水核心,在疏水性电荷图上无序蛋白质与有序蛋白质明显存在于不同的区域图。另外无序蛋白质氨基酸序列的复杂性也较有序蛋白质的低,序列上常常出现重复的区域。Radivojac对此进行过研究,得出不同的氨基酸残基也具有不同的促进无序结构形成的倾向的结论:Gly、Trp、Tyr、Ile、Phe、Val、Leu、His、Thr、Asn比较有利于有序结构的形成;Asp、Met、Lys、Arg、Ser、Glu、Pro、Gln有利于无序的形成,而其它残基的作用则比较中性。无序蛋白质的出现还与氨基酸残基的预期堆积密度(用一定距离内的近邻残基数目来表征)有关联,预期堆积密度低的序列倾向于形成无序蛋白质,密度高的倾向于形成淀粉状聚集结构,而预期堆积密度适中的序列则倾向于形成有序球状蛋白。1.4蛋白质结合位点预测的意义在后基因组时代,生命科学的中心任务是阐明基因组所表达的真正执行生命活动