预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114898801A(43)申请公布日2022.08.12(21)申请号202210706798.6(22)申请日2022.06.21(71)申请人中国农业科学院农业基因组研究所地址518124广东省深圳市大鹏新区鹏飞路7号申请人中国农业科学院深圳农业基因组研究所(72)发明人奉聪宋波程时锋(74)专利代理机构深圳市韦恩肯知识产权代理有限公司44375专利代理师李华双(51)Int.Cl.G16B20/20(2019.01)G06K9/62(2022.01)权利要求书2页说明书5页附图13页(54)发明名称群体单倍型可视化分析方法及系统(57)摘要本发明提供一种群体单倍型可视化分析方法及系统,该分析方法包括:利用Excel文档显示聚类树、样本信息以及每个样本的每个多态性位点的基因型矩阵,并采用不同颜色显示每个窗口标准化深度。可视化分析系统,包括:输入模块,用于将待分析的群体单倍型文件输入,所述群体单倍型文件包括:变异位点文件、比对文件、样本信息数据;分析模块,用于获取聚类树和计算标准化测序深度;可视化模块,根据分析模块提供的聚类树和标准化测序深度,通过Excel表格绘制并显示聚类树、基因型矩阵、标准化测序深度热图,并显示样本信息和变异注释信息。本发明利用excel表格实现了群体单倍型的交互和可视化,实现了对特定基因组区域进行单倍型分析和可视化的完整性,便于研究人员后续的分析研究。CN114898801ACN114898801A权利要求书1/2页1.一种群体单倍型可视化分析方法,其特征在于:包括:利用Excel文档显示聚类树、样本信息以及每个样本的每个多态性位点的基因型矩阵,并采用不同颜色显示每个窗口标准化深度。2.根据权利要求1所述的一种群体单倍型可视化分析方法,其特征在于:所述分析方法包括以下步骤:步骤1,获取包含变异位点、比对文件、样本信息这些数据的群体单倍型文件;步骤2,根据获得的变异位点数据生成变异位点基因型信息和变异位点注释信息,并根据变异位点基因型信息,计算样本距离矩阵,并生成聚类树,进一步获取聚类树的最大深度;步骤3,根据比对文件数据,结合用户指定的碱基窗口大小,计算每个窗口的标准化测序深度;步骤4,根据聚类树的最大深度,采用Excel表格绘制聚类树;步骤5,进一步在绘制完聚类树的Excel表格中导入样本信息和变异位点注释信息,并绘制每个样本的每个多态性位点的基因型矩阵,最后根据步骤3的计算结果在Excel表格中用不同颜色画出每个窗口标准化深度。3.根据权利要求2所述的一种群体单倍型可视化分析方法,其特征在于:所述步骤2计算样本距离矩阵和生成聚类树,是采用层次聚类算法(AgglomerativeHierarchicalClusteringalgorithm)计算两两样本之间的欧氏距离,并采用dynamicTreeCut算法对单倍型进行分类,随后生成聚类树。4.根据权利要求2所述的一种群体单倍型可视化分析方法,其特征在于:所述步骤3计算每个窗口的标准化测序深度,采用如下公式:每个窗口的标准化测序深度=((每个窗口总深度)÷(每个窗口大小))÷(样本平均测序深度)。5.根据权利要求2所述的一种群体单倍型可视化分析方法,其特征在于:所述步骤4中采用Excel文档绘制聚类树,包括:根据用户指定用来绘制聚类树的Excel单元格宽度,用步骤2获取的聚类树的最大深度除以用户指定用来绘制聚类树的Excel单元格宽度,获得Excel文档中每一列表格所代表的树高;接下来遍历步骤2获得的聚类树,依次从叶子节点所对应的边开始,在Excel表格中使用Excel单元格的边框实线从一个单元格开始绘制,通过若干个单元格代表每条边,直到画完根节点所对应的边,聚类树的每条边在Excel表格中所使用的单元格数量等于该条边的高度除每一列表格所代表的树高。6.根据权利要求2所述的一种群体单倍型可视化分析方法,其特征在于:所述步骤5中绘制每个样本的每个多态性位点的基因型矩阵,是在Excel表格中采用不同单元格背景颜色表示不同的基因型,红色背景颜色代表非参考基因组基因型,蓝色背景颜色代表参考基因组基因型,黄色背景颜色代表杂合基因型,灰色背景颜色代表缺失。7.根据权利要求2所述的一种群体单倍型可视化分析方法,其特征在于:所述步骤5中在Excel表格中用不同颜色画出每个窗口标准化深度,每个窗口标准化深度都是采用由灰到黄再到红来代表深度的递增。8.一种群体单倍型可视化分析系统,其特征在于:包括:输入模块,用于将待分析的群体单倍型文件输入,所述群体单倍型文件包括:变异位点2CN114898801A权利要求书2/2页文件、比对文件、样本信息数据;分析模块,用于获取聚类树和计算标准化测序深度;可视化模块,根