预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

云计算环境下的并行SVM算法研究的中期报告 2019年12月14日 一、研究进展 本研究旨在探讨在云计算环境下的并行SVM算法实现。目前已完成初步的文献调研和算法设计,并已进行了一部分的代码实现和测试。 (一)文献调研 在文献调研中,主要针对并行SVM算法、云计算技术以及两者之间的结合进行了研究。其中,对于并行SVM算法,主要调研了基于OpenMP、MPI和MapReduce等技术的并行实现方法,并对比了不同并行化技术的优缺点。同时,也研究了一些针对大规模数据集的优化方法,如IncrementalSVM等。对于云计算技术,主要调研了基于Hadoop、Spark等分布式计算平台上的SVM实现方法,并发现了一些应用SVM的实际场景,如图像分类、文本分类等。 (二)算法设计 基于文献调研的结果,我们选择了基于MPI和OpenMP的并行SVM算法作为研究对象,并在此基础上进行了一定的改进。具体来说,我们将数据集按照类别划分,在每个类别内部使用OpenMP进行并行化,在不同类别之间使用MPI进行通信。同时,我们还考虑了在云计算环境下实现该算法的问题,如数据的分布式存储和调度等。 (三)代码实现与测试 目前,我们已完成了基于C++语言的并行SVM算法的部分代码实现,并进行了一定的测试。测试数据集为libsvm提供的standarddatasets,其中包括了多个文本分类和图像分类的数据集。测试结果显示,我们的并行SVM算法在多核CPU上的性能表现良好,能够有效地加速计算过程。 二、下一步工作 (一)算法细节的优化 目前的代码实现还存在一些问题,如内存使用效率不高和通信开销较大等。我们计划在下一步中对算法进行进一步的优化,以提高算法的性能。 (二)在分布式计算平台上的实现 下一步我们将会将我们的算法移植到云计算平台上,并对其进行测试。我们计划使用AWS或者Azure等云计算提供商的服务进行测试。 三、致谢 感谢指导老师的悉心指导和支持,在他的帮助下本研究取得了一定的进展。同时我们也感谢实验室的其他同学在研究中给予的帮助和支持。