预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106021979A(43)申请公布日2016.10.12(21)申请号201610317618.X(22)申请日2016.05.12(71)申请人北京百迈客云科技有限公司地址101300北京市顺义区南法信府前街12号顺捷大厦5层(72)发明人郑洪坤张增金刘威塔拉(74)专利代理机构北京路浩知识产权代理有限公司11002代理人王文君(51)Int.Cl.G06F19/18(2011.01)G06F19/24(2011.01)权利要求书2页说明书6页附图1页(54)发明名称人基因组重测序数据分析系统及方法(57)摘要本发明提供一种专门针对人基因组重测序数据的分析系统及方法。所述分析系统包括Web交互装置、基础服务模块和数据分析平台。其中Web交互装置用于以Web方式接收用户输入的人基因组重测序数据和参数,并将结果展示给用户;基础服务模块用于对接收的数据和信息生成分析任务;数据分析平台用于根据生成的任务,读取基因组数据,并调用生物信息学软件和数据库,对数据进行分析,获取分析结果。本发明提供的人基因组重测序数据分析系统及方法,通过调用高效准确的生物信息学软件和个性化分析模块,简化了基因组重测序数据分析流程,提高了分析质量及检测结果的准确率,节省了计算机运行时间,同时还能使用户进行数据的重复分析和查询,节省了科研成本。CN106021979ACN106021979A权利要求书1/2页1.人基因组重测序数据分析系统,其特征在于,所述分析系统包括:Web交互装置,以Web方式接收用户输入的人基因组重测序数据和必要的参数,并将结果展示给用户;基础服务模块,用于根据Web交互装置接收的数据和信息生成可进行分析的任务,并对任务进行调度操作;以及数据分析平台,用于根据基础服务模块生成的任务,读取基因组数据,并调用生物信息学软件和数据库,对用户提供的人基因组重测序数据进行分析,获取分析结果。2.根据权利要求1所述的分析系统,其特征在于,所述基础服务模块包括任务调度模块,用于根据所述Web交互装置接收的用户输入的数据和参数生成分析任务,并将分析任务发送至数据分析平台;在任务运行过程中用于实时监测分析任务的运行状态及进度。3.根据权利要求1或2所述的分析系统,其特征在于,所述基础服务模块还包括:结果推送模块,用于在分析任务结束时,通过任务调度模块的调用,将所述数据分析平台得到的分析结果推送至Web交互装置并向用户进行展示;以及数据库交互模块,用于在分析任务结束时,根据所述任务调度模块发送的存储指令,将所述数据分析平台得到的分析结果存储至云端数据库。4.根据权利要求1-3任一项所述的分析系统,其特征在于,所述基础服务模块还包括云端数据库,用于存储分析结果和分析报告,用于用户从所述云端数据库中提取数据进行查询和二次分析。5.根据权利要求1-4任一项所述的分析系统,其特征在于,所述数据分析平台包括数据分析单元和注释数据库;数据分析单元调用的生物信息学软件包括SNP检测、InDel检测、SV检测、CNV检测、基因功能注释和统计绘图软件;以及第三方软件BWA、Samtools、GATK、Picard、Breakdancer、Control-FREEC、Annovar和Blast;注释数据库包括突变注释数据库和功能注释数据库。6.根据权利要求5所述的分析系统,其特征在于,所述数据分析单元包括:数据评估模块,用于对用户输入的人基因组重测序数据进行质量检测,并根据质量检测结果,判断数据是否可以进行后续的分析;其中,所述质量检测包括碱基质量分布检测和碱基类型分布检测;序列比对模块,用于将所述数据评估模块评估后的数据与人参考基因组分别进行比对率统计、测序深度分布统计、插入片段分布统计,从而得到比对率、基因组覆盖深度、基因组覆盖度;所述序列比对模块还用于过滤评估后的数据中的重复序列,得到过滤后的数据;以及突变检测模块,用于通过调用所述生物信息学软件和数据库,对所述过滤后的人基因组重测序数据进行突变检测分析;其中,所述突变检测分析包括单核苷酸多态性检测、插入缺失检测、结构变异检测和拷贝数变异检测。7.根据权利要求6所述的分析系统,其特征在于,所述突变检测模块还能够在突变检测分析过程中,根据突变注释数据库对突变所在的基因组位置进行注释,所述基因位置包括基因区、基因间区和非翻译区;注释需调用注释数据库;其中,所述突变注释数据库包括hg19_ref、wgRna、2CN106021979A权利要求书2/2页wgEncodeGencodeBasicV19、genomicSuperDups、esp6500siv2_all、1000g2014oct_all、1000g2014oct_afr、1000g2014oc