预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共70页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

1定义:单核苷酸多态性(singlenucleotidepolymorphism,SNP),重要是指在基因组水平上由单个核苷酸变异所引起DNA序列多态性。它是人类可遗传变异中最常用一种。占所有已知多态性90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,预计其总数可达300万个甚至更多。SNP所体现多态性只涉及到单个碱基变异,这种变异可由单个碱基转换(transition)或颠换(transversion)所引起,也可由碱基插入或缺失所致。但普通所说SNP并不涉及后两种状况。单核苷酸多态性(SNP)是指在基因组上单个核苷酸变异,涉及置换、颠换、缺失和插入。所谓转换是指同型碱基之间转换,如嘌呤与嘌呤(G2A)、嘧啶与嘧啶(T2C)间替代;所谓颠换是指发生在嘌呤与嘧啶(A2T、A2C、C2G、G2T)之间替代。从理论上来看每一种SNP位点都可以有4种不同变异形式,但事实上发生只有两种,即转换和颠换,两者之比为2:1。SNP在CG序列上浮现最为频繁,并且多是C转换为T,因素是CG中C常为甲基化,自发地脱氨后即成为胸腺嘧啶。普通而言,SNP是指变异频率不不大于1%单核苷酸变异。在人类基因组中大概每1000个碱基就有一种SNP,人类基因组上SNP总量大概是3×106个。根据排列组合原理,SNP一共可以有6种替代状况,即A/G、A/T、A/C、C/G、C/T和G/T,但事实上,转换发生频率占多数,并且是C2T转换为主,其因素是CpGC是甲基化,容易自发脱氨基形成胸腺嘧啶T,CpG也因而变为突变热点。理论上讲,SNP既也许是二等位多态性,也也许是3个或4个等位多态性,但事实上,后两者非常少见,几乎可以忽视。因而,普通所说SNP都是二等位多态性。这种变异也许是转换(CT,在其互补链上则为GA),也也许是颠换(CA,GT,CG,AT)。转换发生率总是明显高于其他几种变异,具备转换型变异SNP约占2/3,其他几种变异发生几率相似。Wang等研究也证明了这一点。转换几率高,也许是由于CpG二核苷酸上胞嘧啶残基是人类基因组中最易发生突变位点,其中大多数是甲基化,可自发地脱去氨基而形成胸腺嘧啶。SNP在动物基因组中分布广泛,每一种核苷酸发生突变概率大概为10-9。由于选取压力,SNP在单个基因、整个基因组中以及种群间分布是不均匀。SNP在非编码区中要多于编码区,并且在编码区也是非同义突变(有氨基酸序列变化)频率比其她方式突变频率低得多[4]。而基因间,同一种基因中编码SNP(codingSNP,cSNP)数目也不相似,可从0~29个不等。多项研究同步发现不同种族间SNPs数目也是不同,非洲人群及非裔种族中SNPs数量最多,而其她种群SNPs要少得多,因而通过比较亚群间等位基因频率将有助于阐明种族构造和进化。在基因组DNA中,任何碱基均有也许发生变异,因而SNP既有也许在基因序列内,也有也许在基因以外非编码序列上。总来说,位于编码区内SNP(codingSNP,cSNP)比较少,由于在外显子内,其变异率仅及周边序列1/5.但它在遗传性疾病研究中却具备重要意义,因而cSNP研究更受关注。从对生物遗传性状影响上来看,cSNP又可分为2种:一种是同义cSNP(synonymouscSNP),即SNP所致编码序列变化并不影响其所翻译蛋白质氨基酸序列,突变碱基与未突变碱基含义相似;另一种是非同义cSNP(non-synonymouscSNP),指碱基序列变化可使以其为蓝本翻译蛋白质序列发生变化,从而影响了蛋白质功能。这种变化常是导致生物性状变化直接因素。cSNP中约有一半为非同义cSNP。先形成SNP在人群中常有更高频率,后形成SNP所占比率较低。各地各民族人群中特定SNP并非一定都存在,其所占比率也不尽相似,但大概有85%应是共通。2.SNP自身特性:1)SNP数量多,分布广泛。据预计,人类基因组中每1000个核苷酸就有一种SNP,人类30亿碱基中共有300万以上SNPs.SNP遍及于整个人类基因组中,依照SNP在基因中位置,可分为基因编码区SNPs(Coding-regionSNPs,cSNPs)、基因周边SNPs(PerigenicSNPs,pSNPs)以及基因间SNPs(IntergenicSNPs,iSNPs)等三类。2)SNP适于迅速、规模化筛查。构成DNA碱基虽然有4种,但SNP普通只有两种碱基构成,因此它是一种二态标记,即二等位基因(biallelic)。由于SNP二态性,非此即彼,在基因组筛选中SNPs往往只需+/-分析,而不用分析片段长度,这就利于发展自动化技术筛选或检测SNPs。3)SNP等位基因频率容易预计。采用混和样本估算等位基因频率是种高效迅速方略。该方略原理是:一方面选取参照样本制作原则曲线,然后将待测