预览加载中,请您耐心等待几秒...
1/1

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

中文文本分类中互信息特征选择方法研究的中期报告 本研究旨在探究中文文本分类中的互信息特征选择方法。在研究过程中,我们首先回顾了互信息特征选择方法的基本概念和原理,以及其在英文文本分类中的应用。接着,我们对中文文本分类中常用的特征表示方法进行了介绍和比较,并选取了其中的两种代表性方法进行了实验。 在实验部分,我们使用了ACM数据集和THUCNews数据集进行实验,使用了朴素贝叶斯分类器和支持向量机分类器作为分类器。实验结果表明,在ACM数据集上,使用互信息特征选择方法进行特征选择后,朴素贝叶斯分类器的分类准确率略有提升,而支持向量机分类器的分类准确率下降;在THUCNews数据集上,使用互信息特征选择方法进行特征选择后,朴素贝叶斯分类器和支持向量机分类器的分类准确率均有所提升。 总的来说,现阶段实验表明互信息特征选择方法在中文文本分类中的应用具有一定的可行性和有效性,但仍需要进一步的实验和研究来验证其在更广泛的数据集和分类任务中的应用情况。同时,我们还需探讨更深入的特征选择方法,以提高中文文本分类的分类准确率。