预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

DNA片段拼接中的预归并重复序列屏蔽方法 DNA序列技术在生物学研究中扮演着非常重要的角色,它可以帮助研究人员了解生物体内的基因信息、生命现象以及遗传变异等问题。然而,DNA片段拼接中的重复序列会给研究工作带来许多干扰,因此需要进行预归并重复序列的屏蔽,本文将探讨这种屏蔽方法的作用、重要性和实现方法。 一、预归并重复序列屏蔽的作用和重要性 DNA的序列中特别重要的是基因区域,而重复区域则是一种非常常见的序列类型,它们会造成不必要的干扰和误判,尤其是在DNA片段的拼接过程中。在没有重复序列屏蔽的情况下,容易发生如下的问题: 1.多次被测序的区域,因为序列的重复,会产生若干条相对相似的DNA序列,这些序列可能会被拼接在一起,造成数据干扰和误判。 2.重复区域中可能会出现一些SNP(SingleNucleotidePolymorphism),这些SNP可能会被当做真正变异的信息,导致诊断结果错误,影响疾病的诊断和治疗。 3.重复区域还可能包含一些特别的序列,如微卫星(microsatellites),他们在每个基因组中存在,并与DNA稳定性、发育和性别等生命现象密切相关。但这些序列如果无法识别、屏蔽,会干扰和影响研究人员对所关注生物信息的研究。 综上所述,预归并重复序列的屏蔽在DNA片段拼接过程中具有重要的作用和意义,可以避免数据的误判和干扰,保证研究结果的准确性。 二、实现预归并重复序列屏蔽的方法 处理DNA序列的程序有很多,并且随着计算机技术的不断更新,新的程序也可能出现。本文介绍三种主要的预归并重复序列屏蔽方法: 1.RepeatMasker RepeatMasker是一种非常可靠的序列屏蔽软件,它可以将DNA序列中的各种重复序列(如简单重复、LTR、SINE)进行屏蔽,识别标准可达到人类近似片段数的百分之九十五以上。该软件使用轮序列(也称库序列)将待处理序列中的重复转录成为一个database,并使用BLAST作为配对搜索算法进行匹配检索。RepeatMasker能够预测出任何嵌合在重复区域中的蛋白质病毒或转座子,并且提供了一些帮助用户解释结果的工具。 2.TandemRepeatsFinder TandemRepeatsFinder是一种描述DNA中重复序列的程序,它可以识别并定位特定类别的重复序列,如微卫星序列。该程序可以将重复序列转成FASTA格式,再用BLAST或其他配对算法进行比对,如果它们被配对到库序列中,则这些重复序列将被屏蔽。 3.MEGA MEGA软件是一种主要用于进化分析的程序,也可用于DNA片段拼接中预归并重复序列的屏蔽。他们基于MaximumLikelihood模型,先进行序列比对,然后通过模拟重复区域和非重复区域之间的概率分布,来计算重复区域被选定的概率。在AproximateBayesianComputation下搜索过多参数的结果表明,程序可以有效地挖掘那些在更好的方案中可能被排除的序列,从而提高了预测结果的精度。 三、结论 DNA片段拼接中预归并重复序列的屏蔽是保证研究准确性的重要手段。预归并重复序列屏蔽的程序与算法多种多样,如RepeatMasker、TandemRepeatsFinder和MEGA等。虽然各自都具有一些独特的特点和优点,但它们的最终目标都是一样的,即减少重复序列造成的误判和干扰,确保更加高质量和准确的研究结果。