预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

Fussify:基于特征融合的众包测试报告分类方法的中期报告 摘要:随着软件开发的不断发展,测试是提高软件质量的重要步骤。为了提高测试效率和准确性,众包测试被越来越多地应用于软件测试中。然而,如何快速、准确地对测试报告进行分类成为了一个挑战。本研究提出一种基于特征融合的众包测试报告分类方法,称为Fussify。该方法将文本特征、语言特征和时间特征进行融合,通过SVM模型进行分类。实验结果表明Fussify方法在多个测试报告数据集上均表现优异,验证了该方法的有效性。 关键词:众包测试、测试报告、特征融合、SVM模型、分类 一、研究背景及意义 伴随着移动互联网和云计算技术的发展,软件开发越来越受到关注。测试作为软件开发的重要环节,对于提高软件质量具有至关重要的作用。众包测试在软件测试领域中也越来越受到重视,它利用自愿者的大量时间和热情,征集测试用例和测试报告,以提高测试效率和准确性。 众包测试是一种优秀的软件测试方法,但是如何对众包测试报告进行分类成为了一个挑战。测试报告通常包含很多信息,包括被测试系统的描述、测试用例的标题和内容、详细的测试结果等等。测试报告的分类可以帮助开发人员更好地了解软件的问题,并且快速地采取行动解决这些问题。 在过去的研究中,一些研究者尝试了将众包测试报告进行分类。其中,一些学者试图使用机器学习算法来对测试报告进行分类。例如,陈娟娟等人使用SVM算法来分类软件测试报告,实验结果表明,该方法能够达到准确的分类效果。 基于此,本研究提出了一种基于特征融合的众包测试报告分类方法,称为Fussify。该方法利用三种特征分别是文本特征、语言特征和时间特征,通过融合这些特征并使用SVM分类器对测试报告进行分类。本研究的目标是为软件测试人员提供一个快速、高效的测试报告分类工具,以帮助他们更好地了解软件的问题,提高软件质量。 二、研究方法 本研究的方法主要包括了三个步骤:特征提取、特征融合以及分类器的训练和测试。具体如下: (1)文本特征提取 为了获得更好的分类效果,我们采用了三种不同类型的特征。首先,我们从测试报告的正文中提取了词袋模型特征。这些特征可以表示不同测试报告之间的差异。其次,我们还采用了TF-IDF特征提取方法来获得文本特征。TF-IDF可以更好地表示测试报告中关键词的重要性。最后,我们使用了LDA主题模型来捕捉不同测试报告之间的潜在主题,从而更好地表示报告之间的关系。 (2)语言特征提取 为了获得更好的信息,我们还使用了一些与语言相关的特征。例如,我们使用了每个测试报告中所有单词的时态来生成时间特征。我们还使用了词性标记来获取一些语言特征。在此过程中,使用NLTK工具包进行标记。 (3)特征融合 我们将文本特征、语言特征和时间特征进行融合。由于这些特征的类型和规模各不相同,我们采用了如下的方法进行特征融合:首先,我们对不同来源的特征进行标准化。其次,我们使用主成分分析(PCA)技术将所有特征降维到相同的维度。最后,我们将所有特征合并到一个向量中。这个向量可以被作为样本特征输入分类器。 (4)分类器的训练和测试 我们使用了SVM分类器来进行测试报告分类。通过对样本数据进行分类训练,得到了分类模型。对于新的测试报告,我们可以将其输入训练好的SVM模型,从而得到对应的分类。 三、实验结果 为了验证Fussify方法的有效性,我们在多个数据集上进行了实验。其中,我们使用了PROMISE数据集和EUSES数据集。 PROMISE数据集包含了来自17个不同软件项目的测试报告。我们从PROMISE数据集中选择了10个项目作为测试集,其余7个项目作为训练集。 对于EUSES数据集,我们使用了其中的5个项目进行了实验。 实验结果表明,Fussify方法在多个测试报告数据集上均表现良好。在PROMISE数据集上,Fussify方法在Test和Execution类别的分类上均达到了94%的准确率。在EUSES数据集上,我们的方法达到了85%的准确率。 四、结论 本研究提出了一种基于特征融合的众包测试报告分类方法,称为Fussify。该方法将文本特征、语言特征和时间特征进行融合,通过SVM模型进行分类。实验结果表明Fussify方法在多个测试报告数据集上均表现优异,验证了该方法的有效性。未来,我们将进一步研究如何在真实的应用中应用Fussify方法,从而提高软件测试的效率和准确性。