一种基于随机森林和序列矩阵的蛋白互作预测方法.pdf
邻家****mk
亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种基于随机森林和序列矩阵的蛋白互作预测方法.pdf
本发明提供了一种基于随机森林和序列矩阵的蛋白互作预测方法。通过获取蛋白质序列,根据序列矩阵蛋白质编码方法,编码蛋白质正相关数据集和蛋白质负相关数据集,获取第一输出序列矩阵;根据所述第一输出矩阵执行特征提取以生成第一特征向量;根据所述第一特征向量以及蛋白互作预测模型对所述蛋白质执行互作预测,并输出预测结果。通过将序列矩阵和随机森林相结合进行蛋白互作预测模型的构建,鉴于随机森林在处理噪声和过拟合方面的优点,以及序列矩阵编码方法编码效率高、编码简单、省时的优点,从而提高了蛋白质相互作用识别的准确率,增强了蛋白相
一种基于位置序列矩阵的蛋白质编码方法.pdf
本发明提供了一种基于位置序列矩阵的蛋白质编码方法,通过根据氨基酸其侧链的偶极性和体积,对所述氨基酸序列进行分类;构建序列矩阵以及位置矩阵;序列矩阵中每个元素用于指示蛋白质序列中所有氨基酸两两组合的频数;位置矩阵用于指示任意两组氨基酸在蛋白质序列中的位置信息;同时选择序列矩阵对角线以及对角线上面的值一起编码氨基酸序列数据,并增加一维序列长度的倒数作为序列矩阵编码的分量得以区分氨基酸序列长度,实现将氨基酸序列数据编码成特征向量。通过将蛋白质序列数据的位置信息和序列信息相结合对蛋白质序列进行编码,能够充分获取蛋
一种基于混淆矩阵的随机森林模型选择方法.pdf
本发明公开一种基于混淆矩阵的随机森林模型选择方法,包括:a.以训练得到的决策树作为原始随机森林,各决策树在测试样本集上进行分类,得到各决策树分类结果的混淆矩阵,通过对随机森林中决策树的混淆矩阵两两作差,得到随机森林中任意两棵决策树的差值矩阵;将差值矩阵的F范数作为两棵决策树的相似性度量,建立随机森林的差异性度量矩阵;c.遍历差异性度量矩阵中不大于相似性阈值的元素;考察该元素所涉及的决策树的分类准确率大小:若低于分类准确率阈值则删除该决策树,将该决策树所在的矩阵行列上的所有元素置零,否则保留该决策树;完成随
基于图理论和互作网络的蛋白质功能预测研究的中期报告.docx
基于图理论和互作网络的蛋白质功能预测研究的中期报告1.研究背景随着生物大数据的不断积累和生物信息学技术的发展,蛋白质功能预测研究成为了当前生命科学研究中的热点问题之一。传统的实验方法难以满足大规模高通量的需求,而基于计算机的生物信息学方法已成为蛋白质功能预测研究的重要手段之一。其中,基于图理论和互作网络的方法被认为是一种有效的蛋白质功能预测方法。2.研究内容本次研究旨在应用图理论和互作网络的方法,对蛋白质功能进行预测。具体研究内容包括以下几个方面:(1)建立互作网络。首先,我们需要从公共数据库中获取蛋白质
《蛋白互作研究方法》PPT课件.ppt
蛋白质相互作用研究方法1研究蛋白质相互作用的意义随着生命现象的研究逐渐由获取基因序列信息转向研究基因功能,一门新的学科———蛋白质组学proteomics应运而生。蛋白质组是一个在空间和时间上动态变化的整体,其功能往往是通过蛋白质之间或与核酸之间相互作用而表现出来的,这种相互作用存在于机体每个细胞的生命活动过程中,相互交叉形成网络,构成细胞中一系列重要生理活动的基础。因此,对于蛋白质相互作用interactome的研究就成为蛋白质组学中最主要研究内容之一。2蛋白质相互作用常用研究方法1酵母双杂交(Yeas