预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

多粒度融合的汉语句子主观性和情感分类方法研究的任务书 任务书 一、任务描述 本任务要求参与者研究多粒度融合的汉语句子主观性和情感分类方法,即针对汉语文本句子进行主观性和情感分类。参与者需要设计和实现模型,使得该模型能够对汉语句子进行分类,并比较不同方法的性能。 二、背景介绍 随着社交网络的快速发展,汉语文本的产生和传播已经成为一种主要的信息交流方式。在互联网上,人们在发布或评论文章时,通常会表达自己的主观感受,如情感、观点、态度等。因此,对汉语文本的主观性和情感分类已经成为一种重要的自然语言处理任务。 主观性和情感分类是指对给定文本进行分类,将文本划分为主观或客观的、正面的或负面的等,以帮助人们理解文本的含义和作者的意图。在这个任务中,我们需要将主观性和情感分类相结合,考虑句子中存在的多种情感,如喜、怒、哀、乐等。 三、任务要求 本任务要求参与者设计和实现一个多粒度融合的汉语句子主观性和情感分类模型,其中要求: 1.数据集 使用公开数据集,如THUCNews、SMP2019任务三、微博情感分析语料等,结合选手自己收集的数据预处理。 2.处理过程 主要包括句子的预处理、特征抽取、特征融合等。特征包括词特征、句法特征、情感词典特征、文本情感特征等,使用CNN、LSTM、BiLSTM、Self-Attention等网络结构进行训练。 3.性能评估 采用F值(F1-score)和准确率(Accuracy)等指标对模型进行性能评估,并对比不同方法的表现。 四、评价标准 1.模型性能:采用F值和准确率等指标,该指标值越高越好。 2.代码实现:代码实现必须符合规范,应有详细注释,易于他人理解。 3.报告:报告中应该包括任务的背景和意义,研究方法,实验结果及其分析,讨论等内容,具有清晰的逻辑结构和合理的语言组织。 五、参考文献 1.Socher,R.,Perelygin,A.,Wu,J.,Chuang,J.,Manning,C.,Ng,A.,&Potts,C.(2013).Recursivedeepmodelsforsemanticcompositionalityoverasentimenttreebank.ConferenceonEmpiricalMethodsinNaturalLanguageProcessing,1631-1642. 2.Kim,Y.(2014).Convolutionalneuralnetworksforsentenceclassification.ConferenceonEmpiricalMethodsinNaturalLanguageProcessing,1746-1751. 3.Zhang,X.,Zhao,J.,&LeCun,Y.(2015).Character-levelconvolutionalnetworksfortextclassification.AdvancementofNeuralInformationProcessingSystems,649-657. 4.Chiu,B.,&Nichols,E.(2015).NamedentityrecognitionwithbidirectionalLSTM-CNNs.TransactionoftheAssociationforComputationalLinguistics,357-370. 5.Zhou,L.,Yang,H.,&Kang,X.(2018).NeuralnetworkmodelsforsentenceclassificationonIMDBandYelpdata.JournalofComputationalScience,68-75. 六、任务分工 本任务为个人任务,选手需个人完成。参与者应该在最后期限前提交代码和报告。