预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共42页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112365922A(43)申请公布日2021.02.12(21)申请号202110039459.2(22)申请日2021.01.13(71)申请人臻和(北京)生物科技有限公司地址100089北京市海淀区花园北路35号9号楼2层205申请人无锡臻和生物科技股份有限公司(72)发明人赵利利谢泓禹于佳宁王小庆洪媛媛陈维之何骥杜波(74)专利代理机构北京康信知识产权代理有限责任公司11240代理人路秀丽(51)Int.Cl.G16B20/00(2019.01)G16B30/10(2019.01)权利要求书8页说明书26页附图7页(54)发明名称用于检测MSI的微卫星位点、其筛选方法及应用(57)摘要本发明提供了一种用于检测MSI的微卫星位点、其筛选方法及应用。其中筛选方法包括:选取≤15bp的A或T的单碱基重复序列且两翼序列相似值低于相似阈值的微卫星位点,记作第一位点集;获取多个MSS样本的测序数据并筛选统计出第一位点集中每个位点的重复单元的类型和每个重复单元的类型频率;选择满足第二条件的位点作为第二位点集,第二条件包括:1)频率最高的重复单元的类型与参考序列一致;2)在建库测序过程中的捕获效率高于捕获阈值;3)在人群中的多态性低于5%;统计并保留第二位点集中每个位点在阴性样本组和阳性样本组之间deletionratio存在显著差异的位点。所筛选的位点能提高检测的灵敏性和特异性。CN112365922ACN112365922A权利要求书1/8页1.一种用于检测MSI的微卫星位点的筛选方法,其特征在于,所述筛选方法包括:选取符合第一条件的微卫星位点,记作第一位点集,所述第一条件包括:a.≤15bp的单碱基重复序列;b.所述单碱基重复序列为A或T的重复序列;c.与所述单碱基重复序列的两翼序列相似值低于相似阈值;获取多个微卫星稳定样本的测序数据,并从每个所述微卫星稳定样本的所述测序数据中筛选出所述第一位点集,并统计所述第一位点集中每个所述微卫星位点的重复单元的类型和每个所述重复单元的类型频率;从所述第一位点集中选择满足第二条件的微卫星位点,作为第二位点集,所述第二条件指包括:1)频率最高的所述重复单元的类型与参考序列一致;2)在建库测序过程中的捕获效率高于捕获阈值;3)在人群中的多态性低于5%;采用多个微卫星稳定样本组成的阴性样本组和多个微卫星不稳定样本组成的阳性样本组,统计所述第二位点集中每个所述微卫星位点在所述阴性样本组和所述阳性样本组之间deletionratio的差异性,并保留所述deletionratio存在显著差异的微卫星位点。2.根据权利要求1所述的筛选方法,其特征在于,从人类参考基因组序列或靶向基因捕获序列中提取符合所述第一条件的微卫星位点,记作第一位点集。3.根据权利要求2所述的筛选方法,其特征在于,从人类参考基因组序列中提取7~15bp的A或T单碱基重复序列的微卫星位点;针对每个所述微卫星位点,计算所述7~15bp的A或T单碱基重复序列的左右两端设定长度的序列与所述A或T单碱基重复序列的相似值;选取所述相似值低于相似阈值的微卫星位点,作为所述第一位点集。4.根据权利要求3所述的筛选方法,其特征在于,所述相似值按如下公式计算:∑(d2+1-d1)/d2,其中d1是所述左右两端设定长度的序列中与微卫星位点碱基相同的碱基到所述微卫星位点的距离,d2为所述设定长度。5.根据权利要求4所述的筛选方法,其特征在于,所述d2为8~12bp。6.根据权利要求4所述的筛选方法,其特征在于,所述d2为10bp。7.根据权利要求3所述的筛选方法,其特征在于,所述相似阈值为1.5~2.5。8.根据权利要求3所述的筛选方法,其特征在于,所述相似阈值为2。9.根据权利要求2所述的筛选方法,其特征在于,获取多个微卫星稳定样本的测序数据,并从每个所述微卫星稳定样本的所述测序数据中筛选出所述第一位点集,并统计所述第一位点集中每个所述微卫星位点的重复单元的类型和每个所述重复单元的类型频率包括:将每个所述微卫星稳定样本的测序数据分别与参考基因组序列进行比对,得到比对结果;从所述比对结果中查找所述第一位点集,并从所述比对结果中提取覆盖所述第一位点集中各所述微卫星位点的spanningreads,所述spanningreads是指覆盖微卫星位点及微卫星位点左右两端至少各2bp的reads;对属于同一重复序列家族的所述spanningreads进行去重,获得每个重复序列家族的重复单元类型;统计每个所述微卫星位点的每种所述重复单元的类型和每种所述重复单元的类型的2CN112365922A权利要求书2/8页频率。10.根据权利要求9所述的筛选方法,其特征在于,对属于同一重复序列家族的所述s