预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110472115A(43)申请公布日2019.11.19(21)申请号201910728636.0(22)申请日2019.08.08(71)申请人东北大学地址110819辽宁省沈阳市和平区文化路3号巷11号(72)发明人韩东红汤玉莹王涛王波涛吴刚刘辉林乔白友夏利(74)专利代理机构沈阳东大知识产权代理有限公司21109代理人李在川(51)Int.Cl.G06F16/9035(2019.01)G06F16/906(2019.01)G06F16/951(2019.01)G06Q50/00(2012.01)权利要求书3页说明书9页附图5页(54)发明名称一种基于深度学习的社交网络文本情感细粒度分类方法(57)摘要本发明提供一种基于深度学习的社交网络文本情感细粒度分类方法,涉及情感多分类领域,本发明使用Scrapy框架爬取社交网络文本数据,进行数据清洗、分词,将分词结果作为word2vec的输入进行词向量转化;基于CNN模型进行文本的情感8分类,将词向量转化结果作为CNN嵌入层的输入,进行卷积、池化、概率计算等前向、反向传播过程训练模型,实现对网络评论情感分类的迁移学习,对社交网络文本进行二轮抽样实现实例迁移、训练分类器,并对评论进行情感预测;对前述工作进行系统设计,对分析结果进行可视化展示,利用MVC三层架构设计展示模块,并针对单文本或多文本情感细粒度分类、跨平台迁移学习文本情感细粒度分类、社交网络热度地图等三方面功能对界面进行设计。CN110472115ACN110472115A权利要求书1/3页1.一种基于深度学习的社交网络文本情感细粒度分类方法,其特征在于:包括以下步骤:步骤1:对待分类的社交网络文本数据进行获取并对数据进行预训练处理;步骤2:利用CNN模型对预训练处理后的社交网络文本数据进行文本情感细粒度分类;步骤3:采用二轮抽样的方法,通过对社交网络文本的实例迁移,对社交网络评价文本训练集的补充,提升社交网络评价文本分类的准确性;步骤4:对社交网络评价文本分析结果进行数据显示,实现基于深度学习的社交网络文本情感细粒度分类系统的可视化显示功能。2.根据权利要求1所述的一种基于深度学习的社交网络文本情感细粒度分类方法,其特征在于:所述步骤1的具体步骤为:步骤1.1:利用Scrapy框架爬取社交网络文本数据,提取出社交网络文本数据中的各个句子;步骤1.2:采用三轮数据清洗法对提取到的社交网络文本数据进行过滤;所述三轮数据清洗法的具体过程如下:第一轮清洗,过滤掉社交网络文本数据中的垃圾文本数据;第二轮清洗,过滤掉社交网络文本数据中纯转发而不评论和回复、重复发布的文本数据;第三轮清洗,过滤掉转发的社交网络文本数据,只保留原创性的社交网络文本数据;步骤1.3:对过滤后的社交网络文本数据进行分词,得到含有g个句子的社交网络文本集合G={d1,...,di,...,dg};步骤1.4:按照篇章对社交网络文本集合G进行处理,得到g个由词组成的集合di={w1,...,wj,...,wn},其中,wj为句子中的第j个单词,然后将第i个集合di中的每一个单词wnn×1送入到word2vec进行词向量的预训练,使其转化为R空间中的特征向量fi=(mi1,...,g×nmij,...,min),将特征向量fi由上至下串联得到g个集合di的R维特征矩阵Fi。3.根据权利要求1所述的一种基于深度学习的社交网络文本情感细粒度分类方法,其特征在于:所述步骤2的具体步骤为:步骤2.1:设置CNN模型嵌入层的维数为特征矩阵Fi的维数n,宽度为特征矩阵Fi的最大宽度Max_d记为Md,卷积层卷积核Ci的宽度为k;g×n步骤2.2:将R维特征矩阵Fi作为CNN模型嵌入层的输入,不足嵌入层宽度的向量矩阵自动补零,在CNN模型的卷积层利用卷积核Ci与特征矩阵Fi从上至下的Md-k+1个子矩阵Tp∈k×nR分别进行卷积操作,得到卷积矩阵S1,...,Si,...,Sg,其中,p∈[1,Md-k+1];所述卷积操作的公式如下:Ag×n*Bg×n=sigmod(∑p∈[1,g],q∈[1,n](apq×bpq+biaspq))(1)其中,Ag×n、Bg×n均表示一个g列n行的矩阵,apq为矩阵Ag×n中第p列第q行的元素,bpq为矩阵Bg×n中第p列第q行的元素,biaspq是偏置矩阵的一个分量;sigmod函数的作用是对特征值归一化;步骤2.3:文本di的特征矩阵Fi与任意一个卷积核Ci均进行Md-k+1次卷积操作,得到卷积矩阵S1,S2,S3,...,Sm;在CNN模型的池化层对得到卷积矩阵S1,...,Si,...,Sg进行池化操2CN110472115A权利要求书2/3页g×1作,简化降