预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共69页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第十一章基因组与比较基因组学20世纪人类科技发展史上的三大创举基因组学是美国人T·H·Rodehck在1986年7月造出来的。 基因组是生物体内遗传信息的集合,是某个特定物种细胞内全部DNA分子的总和(细胞内细胞器的DNA属于该细胞器的基因组)。 原核生物基因组:原核生物DNA分布在整个细胞之中,有时相对集中在类核体上。类核体上的DNA是一条共价、闭合双链分子,类核体通常也称为染色体。这条染色体的DNA就是原核细胞的基因组。 真核生物基因组:一个物种的单倍体的各条染色体中的全部DNA为该物种的基因组(genome)。例如,人有23对染色体,配子——单倍体是23条染色体,这23条染色体中的全部DNA就是人体基因组。一、高通量DNA分析技术1.DNA序列测定的基本原理 无论是对于重组质粒、单个基因还是整个基因组,分析DNA结构的最基本方法就是测定出这些DNA分子的一级结构——DNA序列。 DNA自动测序仪可快速测定DNA序列,计算机处理能力的快速提高则使得大量DNA小片段很容易拼接成较大的片段甚至整个染色体。高效快捷的DNA测序方法是20世纪70年代中期发展起来的,主要有两种:Sanger的双脱氧链终止法和Maxam-Gilbert的化学修饰法。前者因更适应序列分析的自动化而逐渐占据优势。Sanger的双脱氧链终止法 基本原理: 核酸模板在核酸聚合酶、引物、四种单脱氧碱基存在条件下复制或转录时,如果在四管反应系统中分别按比例引入四种双脱氧碱基,只要双脱氧碱基掺入链端,该链就停止延长,链端掺入单脱氧碱基的片段可继续延长。如此每管反应体系中便合成以共同引物为5’端,以双脱氧碱基为3’端的一系列长度不等的核酸片段。反应终止后,分四个泳道进行电泳,以分离长短不一的核酸片段(长度相邻者仅差一个碱基),根据片段3’端的双脱氧碱基,便可依次阅读合成片段的碱基排列顺序。10基因组DNA大片段文库的构建 构建基因文库是测序前必须的预备工作。用细菌的F质粒及其调控基因构建了细菌染色体克隆载体BAC,其克隆能力在125-150kb左右。以BAC为基础的克隆载体转化效率高,而且以环状结构存在于细菌体内,易于分辨和分离纯化。12鸟枪法基因组序列分析技术 DNA序列分析技术一次测序反应的长度不能超过1kb,不能直接用BAC等大片段作为序列分析的模板,采用全基因组鸟枪法测序技术——随机挑选插入基因组DNA的质粒做测序反应,然后用计算机程序进行序列拼接。14采用全基因组鸟枪法测序的基本原理: 对某基因组文库全部克隆片段进行末端序列测定中未测到的碱基数,即缺口(gap),与已测定的总碱基数相关。随着已测定碱基数的增加,缺口的总碱基数目会按照泊松公式的一个推论(P=e-m)迅速减小。其中P为基因组中某个碱基未被测定的概率,m为所测定的碱基数与基因组大小相比的倍数。m越大P值越小。当m=5(即随机测定的碱基数达到基因组5倍),基因组中未测定的碱基数为总碱基数的0.67%(e-5=0.0067)。对流感嗜血杆菌基因组(1.83Mb)来说,可能留有128个平均长为100bp的缺口。全基因组鸟枪法测序的主要步骤是: 第一,建立高度随机、插入片段大小为2kb左右的基因组文库。克隆数要达到一定数量,即经末端测序的克隆片段的碱基总数应达到基因组5倍以上。 第二,高效、大规模的末端测序。对文库中每一个克隆,进行两端测序,TIGR在完成流感嗜血杆菌的基因组时,使用了14台测序仪,用三个月时间完成了必需的28,463个测序反应,测序总长度达6倍基因组。第三,序列集合。TIGR发展了新的软件,修改了序列集合规则以最大限度地排除错误的连锁匹配。 第四,填补缺口。有两种待填补的缺口,一是没有相应模板DNA的物理缺口,二是有模板DNA但未测序的序列缺口。他们建立了插入片段为15-20kb的λ文库以备缺口填补。鸟枪法测序的缺点:随着所测基因组总量增大,所需测序的片段大量增加,各个片段重叠成一个连续体的概率是2n2-2n。20对鸟枪法的改进: Clonecontig法。首先用稀有内切酶把待测基因组降解为数百kb以上的片段,再分别测序。 靶标鸟枪法(diretedshotgun)。首先根据染色体上已知基因和标记的位置来确定部分DNA片段的相对位置,再逐步缩小各片段之间的缺口。改进后的鸟枪测序法原理图23二、人类基因组计划2003年4月14日,国际人类基因组宣布:人类基因组序列图--“完成图”提前绘制成功。 人类基因组包括24条染色体,约30亿对核苷酸,编码5万~6万个基因,人类基因组中携带了有关人类个体生长发育、生老病死的全部遗传信息。 从整体上看,不同人类个体的基因是相同的,因此,我们说“人类只有一个基因组”,人生来是平等的。当然,不同的人可能拥有不同的等位基因,这一点决定了人与人之间个体上的差异