预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于支持向量机和极限学习机的功能位点识别的任务书 一、任务背景 生物信息学是在生物学、计算机科学、数学、信息学等诸多学科的交叉融合下形成的一门新兴学科,它利用计算机技术和信息学方法研究生物信息,如基因序列、蛋白质结构和功能等。其中,功能位点是生物分子的结构中一些关键性质的位置,对于生物学研究非常重要。因此,功能位点识别成为了生物信息学领域的一个重要问题。 功能位点识别是一项基于生物分子序列进行分析和预测的技术,其本质是通过对生物分子序列中的特征进行提取和分析,从而预测序列中具有关键生物学功能的位置。支持向量机(SupportVectorMachine,SVM)和极限学习机(ExtremeLearningMachine,ELM)是两种常用于生物信息学领域的机器学习算法,在功能位点识别任务中也常常被使用。 二、任务描述 本次任务要求实现基于支持向量机和极限学习机的功能位点识别。具体要求如下: 1.首先从生物序列数据集中提取关键特征,例如:氨基酸序列、化学性质、二级结构和稳定性等等。 2.分别使用支持向量机和极限学习机对特征进行训练,并预测序列中的功能位点位置。 3.通过比较两种算法的表现,分析它们在功能位点识别任务中的优缺点,并提出可能的改进策略。 三、任务要求 具体实现时,需要注意以下要求: 1.选择适当的生物序列数据集,并确保数据集的质量和可靠性。 2.在特征提取阶段,考虑哪些特征对功能位点的识别有决定性作用,从而剔除噪声和无用信息。 3.模型的训练和测试需要进行合理的优化,并参考相关文献确定模型参数。 4.请尽可能清晰地呈现实验结果,检查代码是否正确并保证实验数据的可重现性。 5.对于分析结果和改进策略,应展开深入的思考和分析,并结合相关文献进行详细论述。 四、参考文献 [1]KumarR,etal.Functionalsitepredictionofproteinsusingmachinelearningand3Dstructuralinformation.[J]JournalofComputationalBiology,2008,4(11):598-608. [2]WangS,etal.ReviewofSupportVectorMachineAlgorithmintheAnalysisofProteinStructure.[J]InternationalJournalofBiometrics&Biostatistics,2015,2(6):168-176. [3]HuangGB,etal.Extremelearningmachines:asurvey.[J]InternationalJournalofMachineLearningandCybernetics,2014,5(2):121-136. [4]CarpenterB,etal.Combiningsupportvectormachinesandneuralnetworksforimprovedproteinsecondarystructureprediction.[J]Proteins:Structure,Function,andBioinformatics,2005,61(4):943-951.