文本分类方法及装置、设备、存储介质.pdf
爱欢****23
亲,该文档总共24页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
文本分类方法及装置、设备、存储介质.pdf
本申请实施例公开了一种文本分类方法及装置、设备、存储介质;其中,所述方法包括:确定与待分类文本的原始词的相似度大于阈值的概念词,从而得到概念词集;对所述概念词集进行映射处理,得到第一特征矩阵;对所述待分类文本进行映射处理,得到第二特征矩阵;根据所述概念词集、以及所述第一特征矩阵和所述第二特征矩阵,识别所述待分类文本的类别。如此,能够提高对待分类文本类别的识别准确度。
长文本分类方法、装置、设备及存储介质.pdf
本申请实施例提供一种长文本分类方法、装置、设备及存储介质,该方法包括:将获取的目标长文本划分成N个序列后输入目标模型中,分别得到N个序列的文本表示,N为正整数;对N个序列的文本表示进行融合,得到目标长文本的篇章表示;根据目标长文本的篇章表示,得到目标长文本的分类结果。也就是说,本申请将目标长文本的N个序列的文本表示进行融合,得到整个目标长文本的篇章表示,基于整个目标长文本的篇章表示进行分类,即在分类过程中考虑了整个文本的语义信息和上下文信息,进而提高了目标长文本的分类准确性。
文本内容分类方法、装置、电子设备及存储介质.pdf
本公开提供了一种文本内容分类方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及深度学习技术领域。具体实现方案为:获取目标文本内容的名称,简介和章节标题;提取名称的名称特征,简介的简介特征和章节标题的章节标题特征;基于名称特征,简介特征和章节标题特征,以及名称特征,简介特征和章节标题特征之间的关联关系,预测目标文本内容在多个分类维度上的标签。通过上述处理,可以高效、准确地实现对文本内容的多标签分类。
文本处理方法、文本分类方法、装置、设备及存储介质.pdf
本公开关于一种文本处理方法、文本分类方法、装置、设备及存储介质,该文本分类方法包括:获取待处理文本;在待处理文本的长度大于预设长度的情况下,从待处理文本中提取出预设长度的第一子文本;在第二子文本包括预设字符的情况下,拼接预设字符和第一子文本中的多个字符,得到预设长度的第一目标拼接文本;其中,第二子文本为待处理文本中除第一子文本之外的文本。本公开既解决了长文本字数不符合语言模型要求的问题,又可以从长文本中截取表示文本核心内容的关键字符和需要监测的主题名称的第一目标拼接文本对模型训练,从而提升了模型的性能,使
文本分类方法、装置、电子设备及存储介质.pdf
本发明涉及人工智能领域,揭露一种文本分类方法,包括:对文本类别集及样本集执行编码处理,得到初始标签矩阵及样本集中每个样本的每个字符对应的第一向量;对第一向量及初始标签矩阵执行相关性分析,得到每个字符对应的第二向量,并确定样本集中每个样本对应的第三向量;对第三向量执行分类处理,得到每个样本在每个文本类别的预测概率值;将文本类别标签及对应预测概率值输入损失函数,得到损失值,通过最小化损失值,确定目标标签矩阵及训练好的文本分类模型;将待分类文本及目标标签矩阵输入训练好的文本分类模型,得到目标文本类别。本发明还提