预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利(10)授权公告号CN108681661B(45)授权公告日2022.02.18(21)申请号201810468822.0(56)对比文件CN10(22)申请日2018.05.166555226A,2017.04.05CN101619352A,2010.01.06(65)同一申请的已公布的文献号CN107365865A,2017.11.21申请公布号CN108681661ACN106169034A,2016.11.30(43)申请公布日2018.10.19US2016244830A1,2016.08.25(73)专利权人杭州迈迪科生物科技有限公司CN102952854A,2013.03.06地址311305浙江省杭州市临安区青山湖朱忠旭等.单细胞测序技术及应用进展.科技城创业街199号3楼《基因组学与应用生物学》.2015,第34卷(第5期),902-908.(72)发明人朱忠旭周文莉杨克勤牛成镇审查员谢琳(74)专利代理机构北京志霖恒远知识产权代理事务所(普通合伙)11435代理人奚丽萍(51)Int.Cl.G16B20/30(2019.01)G16B50/00(2019.01)权利要求书1页说明书7页附图1页(54)发明名称一种伴随实验生成样本ID的方法(57)摘要本发明涉及一种伴随实验生成样本ID的方法,包括用于生成ID的基因位点的挑选和伴随高通量测序流程生成样本编码ID两个步骤。通过缩小基因位点范围,快速筛选出一定数目的位点用于验证样本是否错误标记或者污染,可简单快速地判断样本是否一致,识别样本集或实验中意外样本混淆错误,保证实验结果的准确可靠。CN108681661BCN108681661B权利要求书1/1页1.一种伴随实验生成样本ID的方法,其特征在于:包括用于生成ID的基因位点的挑选和伴随高通量测序流程生成样本编码ID两个步骤;所述用于生成ID的基因位点的挑选包含以下步骤:检索基因组数据库、生成基因型位点列表信息、统计每个位点的基因型频率、缩小基因位点范围;所述伴随高通量测序流程生成样本编码ID包含以下步骤:根据所述挑选的用于生成ID的基因位点的多态性生成ID编码,每个基因位点生成一个一位数字,一系列的基因位点按顺序排列组成该样本的编码ID,用于代表该样本。2.根据权利要求1所述的伴随实验生成样本ID的方法,其特征在于:所述用于生成ID的基因位点挑选包含以下步骤:(1)检索基因组数据库:检索基因组数据库的基因型数据表中基因位点,导出所有基因位点到本地文本文件,文本文件每一行为一个基因位点;(2)生成基因型位点列表信息:对文本文件内容的进行再一次检索,如有基因位点出现两次或多次,则只保留一个,生成的文本文件为基因型位点列表文件;(3)统计每个位点的基因型频率:读取生成的基因型位点列表文件,每读取一行即一个基因位点,以该基因位点为检索条件,统计该基因位点的纯合野生基因型、杂合突变基因型和纯合突变基因型三种基因型出现的次数,每种基因型出现的次数累加得到基因位点的所有基因型出现的总次数,将每种基因型出现的次数除以该位点所有基因型出现的总次数得到该位点特定基因型的频率;循环读取和检索统计每个基因位点的相关信息,将得到结果输出至本地基因型频率数据文件;(4)缩小基因位点范围:包括以下三种缩小步骤,各个步骤顺序不限:a.根据基因型频率缩小位点范围:循环读取本地基因型频率数据文件,筛选满足以下条件的基因位点用于生成编码ID的候选基因位点:1)基因位点在数据库中至少出现两种基因型,2)基因位点的所有基因型出现总次数应大于200,3)若基因位点有三种基因型,筛选出杂合突变基因型频率大约为50%,纯合野生基因型和纯合突变基因型大约各为25%,若基因位点只有两种基因型,且两种基因型的频率各约为50%,筛选后更新本地基因型频率数据文件,仅保留符合条件的基因位点;b.根据位点相邻距离缩小位点范围:批量读取基因型频率数据文件,将距离小于100Kb的临近基因位点,随机选取保留一个,更新本地基因型频率数据文件,仅保留符合条件的基因位点;c.根据其他的基因组数据库位点基因型频率缩小位点范围:循环读取本地基因型频率数据文件,进一步筛选同时满足以下两个条件的候选基因位点:1)基因型频率数据与其他基因组数据库数据一致,2)基因位点在世界各大人群中频率变化很小,筛选后再次更新基因型频率数据文件,仅保留符合条件的基因位点。3.根据权利要求2所述的伴随实验生成样本ID的方法,其特征在于:所述用于生成ID的基因位点挑选步骤(1)检索的基因组数据库是公开基因组数据库或者自有基因组数据库。2CN108681661B说明书1/7页一种伴随实验生成样本ID的方法技术领域[0001]本发明涉及临床医学检验领域,具体涉及一