预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109321646A(43)申请公布日2019.02.12(21)申请号201811062698.4(22)申请日2018.09.12(71)申请人山东省农作物种质资源中心地址250101山东省济南市历城区工业北路202号(72)发明人段乃彬马玉敏王效睦杨永义白静谢坤宫永超(74)专利代理机构济南诚智商标专利事务所有限公司37105代理人韩百翠(51)Int.Cl.C12Q1/6869(2018.01)G16B30/10(2019.01)权利要求书1页说明书3页附图1页(54)发明名称基于NGS读段与参考序列比对的虚拟PCR方法(57)摘要本发明公开了一种基于NGS读段与参考序列比对的虚拟PCR方法。该方法先基于NGS测序技术对试验样品全基因组进行一次深度较高的高通量测序,获得覆盖全基因组的海量测序读段;再结合生物信息学方法,以被研究的目标基因片段S1作为参考序列,将试验样品的测序读段与之进行严谨比对,并在程序中转化成目标基因片段S1在本样品对应的同源序列S2,虚拟PCR完成。该方法可延长的最大片段为200k甚至更高,远高于WetLabPCR中酶与反应体系的限制;其只需要一小时即可完成5k碱基的比对与序列再生,缩短了实验周期;结合中间程序,可同时统计SNP和其他变异的情况,同步可完成映射比对和变异统计。CN109321646ACN109321646A权利要求书1/1页1.基于NGS读段与参考序列比对的虚拟PCR方法,其特征在于,包括如下步骤:1)对实验材料的NGS测序:选择所需的实验材料提取长片段DNA,将长片段DNA随即打断后加载到基因芯片中,使用测序仪进行边合成边测序,获得各样品的短片段90-150bp成对的测序读段数据;2)测序读段数据的预处理:将步骤1)中获得的测序读段数据去除测序重复,去除测序接头、Barcode及低质量数据;3)虚拟PCR扩增:以被研究的目标基因片段S1作为参考序列,将试验样品的测序读段数据与之进行严谨比对,并在程序中转化成目标基因片段S1在本样品对应的同源序列S2,至此虚拟PCR完成。2.如权利要求2所述的虚拟PCR方法,其特征在于,所述的NGC测序的覆盖度不低于50X。3.如权利要求1或2所述的虚拟PCR方法,其特征在于,所述的步骤3)的虚拟PCR扩增包括以下步骤:a)获取目标基因片段S1的序列并建立索引;b)将经过步骤2)处理后的测序读段数据与参考序列S1在软件中进行严格比对,设置错配参数mismatch=0,生成比对文件;c)浏览步骤b)获得的比对文件,经过比对软件核实被测样品是否存在GAP,如有则上调mismatch参数+1,重新进入步骤b)的比对步骤;d)将比对生成的文件转换成Pileup格式文件;e)将步骤d)获得的Pileup文件再转换为可以显示碱基排序的文件;f)进一步将步骤e)获得的文件中的碱基的列转换为行,从而得到目的基因片段S1在被测样品的同源序列S2,同时获得S2的序列信息、SNP及结构变异信息并反馈这些信息至步骤c)所述比对软件中核实,至此虚拟PCR完成。4.如权利要求3所述的虚拟PCR方法,其特征在于,当所述步骤c)中的mismath参数达到了4,而所述比对软件仍然在比对文件中检测到GAP存在,则表明序列扩增失败,即试验样品中不存在参考序列S1的同源序列。2CN109321646A说明书1/3页基于NGS读段与参考序列比对的虚拟PCR方法技术领域[0001]本发明涉及生物信息学领域,具体涉及一种基于NGS读段与参考序列比对的虚拟PCR方法。背景技术[0002]聚合酶链式反应(PCR)是一种用于放大扩增特定的DNA片段的分子生物学技术,它可看作是生物体外的特殊DNA复制。PCR技术的基本原理类似于DNA的天然的半保留复制过程,其特异性依赖于与靶序列两端互补的寡核苷酸引物。PCR由变性--退火--延伸三个基本反应步骤构成,不断重复循环变性--退火--延伸三过程就可将待扩增的目的基因扩增放大几百万倍。[0003]NGS测序又称二代测序获得的,目前高通量测序的主要平台代表有罗氏公司(Roche)的454测序仪(RochGSFLXsequencer),Illumina公司的Solexa基因组分析仪(IlluminaGenomeAnalyzer)和ABI的SOLiD测序仪(ABISOLiDsequencer)。不同的NGS平台均可并行地对数百万个小DNA片段进行测序,而获得海量测序数据即测序读段(reads)。这些读段组合在一起可进行基因组的组装,也可将每个读段映射到参考基因组而进行基因组比对。NGS不仅用于整个基因组测序也可对特定的感兴趣区域,包括所有编码基因(整个外显子组)或少量个体基因。[0004]