预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共36页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110383385A(43)申请公布日2019.10.25(21)申请号201780075938.1(74)专利代理机构上海专利商标事务所有限公司31(22)申请日2017.12.07100代理人陶家蓉陈扬扬(30)优先权数据62/431,4932016.12.08US(51)Int.Cl.62/579,6452017.10.31USG16B20/20(2019.01)62/585,5982017.11.14USG16B50/30(2019.01)(85)PCT国际申请进入国家阶段日2019.06.06(86)PCT国际申请的申请数据PCT/US2017/0650532017.12.07(87)PCT国际申请的公布数据WO2018/106884EN2018.06.14(71)申请人生命科技股份有限公司地址美国加利福尼亚州(72)发明人R·查达瑞F·海兰德权利要求书2页说明书18页附图15页(54)发明名称从肿瘤样品中检测突变负荷的方法(57)摘要可以处理一种对仅肿瘤样品具有低样品输入要求的靶向组以估计肿瘤样品中的突变负荷。所述方法包括检测对应于所述肿瘤样品基因组中的靶向位置的核酸序列读数中的变体;用来自群体数据库的注释信息注释检测到的变体;过滤所述检测到的变体,其中所述过滤规则集保留所述体细胞变体并去除种系变体;对所述所识别的体细胞变体进行计数,以得到体细胞变体的数量;确定所述肿瘤样品基因组中所述靶向位置的覆盖区域中的碱基的数量;和计算每兆碱基的体细胞变体的数量,提供所述肿瘤样品基因组中每兆碱基的所述突变负荷的估计值。CN110383385ACN110383385A权利要求书1/2页1.一种分析肿瘤样品基因组的突变负荷的方法,其包含:检测多个核酸序列读数中的变体以产生多个检测到的变体,其中所述核酸序列读数对应于所述肿瘤样品基因组中的多个靶向位置,其中所述检测到的变体包括体细胞变体和种系变体;用来自一个或多个群体数据库的注释信息注释所述多个检测到的变体中的一个或多个检测到的变体,其中所述群体数据库包括与群体中变体相关的信息,其中所述注释信息包括与给定变体相关的次要等位基因频率;过滤所述多个检测到的变体,其中所述过滤将规则集施加到所述检测到的变体以保留所述体细胞变体,所述规则集包括保留次要等位基因频率(MAF)在MAF范围内的所述检测到的变体,其中所述过滤产生所识别的体细胞变体;计数所述所识别的体细胞变体,以得到体细胞变体的数量;确定所述肿瘤样品基因组中所述靶向位置的覆盖区域中的碱基的数量;和通过将所识别的体细胞变体的数量除以所述覆盖区域中的碱基的数量来计算每兆碱基的体细胞变体的数量,以产生所述肿瘤样品基因组的所述突变负荷。2.根据权利要求1所述的方法,其中所述MAF范围是0到10-6。3.根据权利要求1所述的方法,其中所述群体数据库包括1000个基因组数据库、5000个外显子组数据库和外显子组聚集联合体(ExAC)数据库中的一个或多个。4.根据权利要求1所述的方法,其中所述规则集还包含保留所述检测到的变体,其中所述检测到的变体是单核苷酸变体(SNV)。5.根据权利要求1所述的方法,其中所述规则集还包含保留所述检测到的变体、插入变体和缺失变体(插入缺失),其中所述检测到的变体是SNV。6.根据权利要求1所述的方法,其中所述规则集还包含去除所述检测到的变体,所述检测到的变体是与UCSC公共SNP数据库中的SNP相对应的SNV。7.根据权利要求1所述的方法,其中所述规则集还包含在均聚物长度大于七的区域中去除所述检测到的变体。8.根据权利要求1所述的方法,其中所述检测变体由变体调用者参数配置,所述变体调用者参数包括最小等位基因频率参数、链偏移参数和数据质量严格性参数。9.根据权利要求8所述的方法,其中所述最小等位基因频率参数在0.001到0.15范围内,所述链偏移参数在0.54到0.95范围内,并且所述数据质量严格性参数在5到25范围内。10.根据权利要求1所述的方法,其还包含使体细胞突变损伤的来源与所述所识别的体细胞变体相关联。11.一种用于分析肿瘤样品基因组的突变负荷的系统,其包含处理器和与所述处理器通信连接的数据存储器,所述处理器配置成进行以下步骤,包括:检测多个核酸序列读数中的变体以产生多个检测到的变体,其中所述核酸序列读数对应于所述肿瘤样品基因组中的多个靶向位置,其中所述检测到的变体包括体细胞变体和种系变体;用来自存储在所述数据存储器中的一个或多个群体数据库的注释信息注释所述多个检测到的变体中的一个或多个检测到的变体,其中所述群体数据库包括与群体中变体相关的信息,其中所述注释信息包括与给定变体相关的次要等位基因频率;2CN110383385A权利要求