一种基于深度学习的中文文本分类方法-豆柴文库

一种基于深度学习的中文文本分类方法.pdf

2023-11-05

10金币

454KB

8页

一条****杉淑

实名认证

内容提供者

1/8

2/8

3/8

4/8

5/8

6/8

7/8

8/8

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114912461A(43)申请公布日2022.08.16(21)申请号202210614817.2G06N3/08(2006.01)(22)申请日2022.05.31(71)申请人浙江工业大学地址310014浙江省杭州市拱墅区潮王路18号(72)发明人钱丽萍钱江王寅生张文杰王倩(74)专利代理机构浙江千克知识产权代理有限公司33246专利代理师赵芳(51)Int.Cl.G06F40/30(2020.01)G06F40/289(2020.01)G06K9/62(2022.01)G06N3/04(2006.01)权利要求书2页说明书4页附图1页(54)发明名称一种基于深度学习的中文文本分类方法(57)摘要一种基于深度学习的中文文本分类方法，结合Word2Vec词向量与LDA词向量作为词嵌入以增强文本主题特征；编码阶段将自注意力机制以及RNN网络结合可以实现对文本进行深度语义特征提取的同时保留序列特征。本发明对于输入的一篇中文文本，运用系统模型，能够有效提升文本分类的准确率。本发明融合了Word2Vec词向量与LDA词向量作为词嵌入，并结合了循环神经网络(RNN)以及自注意力机制(Self‑Attention)的特征提取优势，极大程度上改善了文本分类准确率，从而使得人们的信息处理效率进一步提升。CN114912461ACN114912461A权利要求书1/2页1.一种基于深度学习的中文文本分类方法，其特征在于，所述方法包括以下步骤：1)首先对输入文本进行预处理操作，过程如下：去除停用词、特殊符号；利用Jieba中文分词工具进行分词处理，得到w1,w2,w3,···,wn，接着运用Word2Vec中文预训练模型输出每一个单词所对应的词向量，用c1,c2,c3,···,cn表示，词向量组c1,c2,c3,···,cn记作矩阵WC；运用训练好的LDA模型输出文本的主题‑词矩阵记为WT，最后将矩阵WC和矩阵WT按对应向量进行拼接操作得到n×dmodel维矩阵WE，dmodel为词向量维数，满足WE＝[WC,WT](1)2)将矩阵WE输入至编码器，首先进行位置编码得到矩阵P，计算过程说明如下：3)将矩阵P与矩阵WE相加得到最终的n×dmodel维词嵌入矩阵WI，公式如下：WI＝WE+P(3)4)将矩阵输入WI至自注意力机制，生成n×dmodel维矩阵M，公式如下：Q＝WI×WQ(5)K＝WI×WK(6)V＝WI×WV(7)其中，WQ、WK、WV为可训练dmodel维参数方阵，dk为可调超参数；5)将矩阵M和WI进行残差与归一化操作，得到n×dmodel维矩阵N1，公式如下：N1＝LayerNorm(Μ+WI)(8)6)将矩阵N1输入至前馈神经网络，得到n×dmodel维矩阵F，公式如下：F＝max(0,N2W1+B1)W2+B2(9)其中W1、W2为神经网络权重矩阵，B1、B2为神经网络偏置项；7)下一步，将矩阵WI输入至单隐藏层循环神经网络，将每一个时刻隐藏层输出向量保存，记为矩阵R1，dr为RNN网络维数；8)将矩阵R1进行线性变换为n×dmodel维矩阵公式如下其中，WL为dr×dmodel维可训练参数矩阵；9)将矩阵F、以及N1进行残差和归一化操作得到矩阵N2，公式如下10)取矩阵N2的首个向量输入至分类器，首先经过前馈神经网络，输出df维向量f，公式如下：f＝(vCLS·w1+b1)w2+b2(12)2CN114912461A权利要求书2/2页其中，vCLS为N2的首个向量，w1、w2为神经网络权重，b1、b2为神经网络偏置项，df为神经网络维数；11)将向量f元素进行Softmax运算，数值最大的维度便对应文本类别yp，公式如下：yp＝softmax(f)(13)12)通过交叉熵损失函数来训练模型参数，模型参数包括矩阵元素与神经网络权重及偏置项，损失函数如下所示：其中，M为训练样本总数，yt为真实类别，yp为预测类别。3CN114912461A说明书1/4页一种基于深度学习的中文文本分类方法技术领域[0001]本发明属于人工智能领域，尤其是一种基于深度学习的中文文本分类方法。背景技术[0002]随着近年来网络信息的爆炸式增长，错综复杂的文本信息充斥着人们的生活。为了提高人们处理和理解信息的效率，有人运用文本分类技术对文本信息进行分门别类，从而提高阅读的效率。但是，基于传统机器学习的文本分类模型，如隐马尔可夫模型，决策树模型等难以对文本深度提取语义特征，无法满足文本分类高准确率的要求，近年来有学者提出基于深度神经网络来进行文本分类，使得分类效果较传统机器学习方法有了一定的进步。发明内容[0003]为了解决传统机器学习方法无法提取语义特征，导致分类准确率低的不足，本发明

相关资料

一种基于深度学习的中文文本分类方法.pdf

一种基于深度学习的中文文本分类方法，结合Word2Vec词向量与LDA词向量作为词嵌入以增强文本主题特征；编码阶段将自注意力机制以及RNN网络结合可以实现对文本进行深度语义特征提取的同时保留序列特征。本发明对于输入的一篇中文文本，运用系统模型，能够有效提升文本分类的准确率。本发明融合了Word2Vec词向量与LDA词向量作为词嵌入，并结合了循环神经网络(RNN)以及自注意力机制(Self‑Attention)的特征提取优势，极大程度上改善了文本分类准确率，从而使得人们的信息处理效率进一步提升。

2023-11-05

454KB

基于深度学习的中文文本分类综述.docx

基于深度学习的中文文本分类综述目录一、内容概览................................................21.1文本分类的意义.......................................31.2深度学习在文本分类中的应用现状.......................4二、深度学习模型概述........................................52.1神经网络模型...............................

2024-09-15

30KB

一种基于图深度学习的文本多标签分类方法和系统.pdf

本发明公开了基于图深度学习的文本多标签分类方法和系统,在金融领域少标注样本且标签间存在业务关联的前提下,依靠基于图深度学习的文本分类方法,自动化解决文本多标签分裂问题。其技术方案为:对原始采集数据进行预处理并进行文本向量化的处理,基于中文分词后转化为文本向量;对文本向量化结果,使用多标签注意力网络提取文本特征,最终得到文本特征提取结果;在文本特征提取的基础上,构建图语义交互层,得到融合图语义交互层的混合文本向量化的结果;在融入语义交互层的文本向量化表示基础上,采用特定损失函数训练模型进行训练,得到输入文本

2023-05-18

783KB

一种基于深度学习的盲文转中文方法.pdf

本发明公开了一种基于深度学习的盲文转中文方法。它具体包括如下步骤：(1)对盲文文本预处理：盲文文本预处理对盲文做编码归一化处理；(2)深度学习算法模型构建：深度学习算法模型学习编码后的文本规律；(3)训练深度学习模型：通过深度学习模型翻译出对应的中文内容；(4)文本纠错：在文本纠错单元对盲文中的错别字进一步纠错。本发明的有益效果是：达到高精准度文本翻译结果。

2023-06-27

234KB

一种基于深度学习的社交网络文本情感细粒度分类方法.pdf

本发明提供一种基于深度学习的社交网络文本情感细粒度分类方法，涉及情感多分类领域，本发明使用Scrapy框架爬取社交网络文本数据，进行数据清洗、分词，将分词结果作为word2vec的输入进行词向量转化；基于CNN模型进行文本的情感8分类，将词向量转化结果作为CNN嵌入层的输入，进行卷积、池化、概率计算等前向、反向传播过程训练模型，实现对网络评论情感分类的迁移学习，对社交网络文本进行二轮抽样实现实例迁移、训练分类器，并对评论进行情感预测；对前述工作进行系统设计，对分析结果进行可视化展示，利用MVC三层架构设计

2023-08-28

868KB