预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共34页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114250279A(43)申请公布日2022.03.29(21)申请号202011004177.0(22)申请日2020.09.22(71)申请人上海韦翰斯生物医药科技有限公司地址201318上海市浦东新区康新公路3399弄25号534室(72)发明人杨敬敏唐嘉婕徐辉卢大儒高鹏飞徐张蓝(74)专利代理机构上海光华专利事务所(普通合伙)31219代理人许亦琳余明伟(51)Int.Cl.C12Q1/6858(2018.01)权利要求书1页说明书14页序列表12页附图6页(54)发明名称一种单倍型的构建方法(57)摘要本发明涉及分子生物学技术领域,特别是涉及一种单倍型的构建方法,所述构建方法包括以下步骤:针对目的基因设计多对PCR引物,以使扩增后相邻两条PCR产物具有重叠区域,且所有PCR产物能完全覆盖目的基因;利用设计的PCR引物扩增目的基因;以扩增得到的所有PCR产物为模板进行长读长二代测序文库构建并上机测序;数据分析:通过组装获得目的基因的单倍型信息。可以利用现有的长读长二代测序技术实现目标区域的靶向单倍型检测,极大地提高现有的长读长二代测序技术的应用范围;此外,也在靶向测序领域实现了单倍型检测的可能;以更低的成本实现靶向基因组单倍型检测,且准确率达到了100%。CN114250279ACN114250279A权利要求书1/1页1.一种单倍型的构建方法,其特征在于,所述构建方法包括以下步骤:1)针对目的基因设计多对PCR引物,以使扩增后相邻两条PCR产物具有重叠区域,且所有PCR产物能完全覆盖目的基因;2)利用步骤1)的PCR引物扩增目的基因;3)以扩增得到的所有PCR产物为模板进行长读长二代测序文库构建并上机测序;4)数据分析获得目的基因的单倍型信息。2.根据权利要求1所述的构建方法,其特征在于,步骤1)中设计PCR引物所针对的目的基因包括:目的基因的基因组区域及基因组上下游区域。3.根据权利要求1所述的构建方法,其特征在于,步骤1)中设计PCR引物所针对的目的基因包括:目的基因的基因组区域及基因组上下游各10~200kb的区域。4.根据权利要求1所述的构建方法,其特征在于,步骤1)中每一对引物扩增的PCR产物的理论长度至少为17kb;优选的,PCR产物的理论长度为18~22kb。5.根据权利要求1所述的构建方法,其特征在于,步骤1)中相邻两条PCR产物有1~10kb的重叠区域。6.根据权利要求1所述的构建方法,其特征在于,步骤2)中PCR扩增完毕后,再设计质控引物以步骤2)得到的PCR产物为模板二次扩增进行质控。7.根据权利要求1所述的构建方法,其特征在于,所述步骤3)中长读长二代测序文库通过LinkedLongreadSequencing技术构建。8.根据权利要求1所述的构建方法,其特征在于,上机测序的平台选自二代测序平台。9.根据权利要求1所述的构建方法,其特征在于,数据分析采用的软件为HapCUT2、Tell-SeqDataAnalysisSoftware、R软件中的一种或几种。10.根据权利要求1-10任一所述的构建方法,其特征在于,所述单倍型为单基因的单倍型。2CN114250279A说明书1/14页一种单倍型的构建方法技术领域[0001]本发明涉及分子生物学技术领域,特别是涉及一种单倍型的构建方法。背景技术[0002]人是二倍体生物,即含有两组染色体,单组染色体即为单倍体。在单倍体中,紧密连锁的多个等位基因的线性组合,每种组合方式即为一种单倍型。单倍型可以由多个SNP位点构成,包含丰富的遗传信息,研究单倍型比单个SNP位点具有更好的分析效果,更能有效反映出疾病的遗传机制,其在遗传病检测领域有着广泛的需求。[0003]遗传信息的变异是所有基因组的共同特征,而单碱基对的差异,也称单核苷酸多态性(SNP)是变异中最常见的一种形式,占所有已知多态性的90%以上。SNP位点并不是独立遗传的,而是在染色体上成组地遗传。一般来说,一个SNP位点只有两种等位基因,因此又叫双等位基因。单核苷酸多态性是研究人类家族和动植物品系遗传变异的重要依据,因此被广泛用于群体遗传学研究和疾病相关基因的研究,在药物基因组学、诊断学和生物医学研究中起重要作用。[0004]基因分型(Phasing)还称为基因定相、单倍体分型或单倍体构建。基因分型是指把二倍体(甚至是多倍体)基因组上的等位基因(包括杂合位点,例如SNP),按照其亲本正确地定位到父亲或者母亲的染色体上,最终使得所有来自同一个亲本的等位基因都能够排列在同一条染色体里。现有的NGS测序技术都是把序列打乱混在一起测序。这种方法无法直接区分这些序列中哪一个是父源,哪一个是母源的。通常只能检测出基因组上有哪些变异,以