文本预处理方法、分类方法、装置及设备.pdf
一只****呀淑
亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
文本预处理方法、分类方法、装置及设备.pdf
本说明书实施例提供一种文本预处理方法、分类方法、装置及设备。在获取待处理文本后,可以判断待处理文本的长度是否大于指定长度,如果大于,则以待处理文本中至少一个指定字符作为位置参考,从文本中截取出多个字符,并将截取的字符拼接,得到长度等于指定长度的新文本,然后用新文本对预设的语言模型进行训练。通过对长文本进行截断拼接,可以从长文本中截取表示核心内容的关键字符,拼接得到长度满足语言模型要求的新文本,再通过新文本对语言模型进行训练,使得长文本可以得到模型的支持,且通过模型对长文本中的核心内容的学习,提升了模型的性
分类模型的训练方法、文本分类方法、装置及设备.pdf
本申请提供一种分类模型的训练方法、文本分类方法、装置及设备,该分类模型的训练方法包括:电子设备根据多个样本文本,构建样本词表,根据样本词表,生成词向量矩阵,根据至少一个样本文本和词向量矩阵,对神经网络模型进行至少一轮训练,得到分类模型。其中,任一轮训练过程包括:根据上一轮训练得到的神经网络模型、样本文本以及词向量矩阵,确定各类标向量对应的多个目标词向量,并根据上一轮训练得到的神经网络模型、各类标向量以及对应的多个目标词向量,确定样本文本的文本语义向量,基于文本语义向量生成本轮训练得到的神经网络模型。在技术
文本分类模型的训练方法、文本分类方法、装置和设备.pdf
本申请提供一种文本分类模型的训练方法、文本分类方法、装置和设备,该方法包括:获取多条浏览器的历史弹窗内的文本信息;对每个文本信息进行分词处理,根据分词结果确定出每个文本信息对应的第一特征向量;对第一特征向量进行聚类,得到至少一个文本信息组;从每个文本信息组中,分别选出至少一条目标文本信息,并对每个目标文本信息添加类型标识,以形成至少一个文本信息模板;根据至少一个文本信息模板,对初始文本分类模型进行训练,得到文本分类模型。通过该方法,能够解决现有技术中无法对浏览器弹窗日志进行分析的问题,基于训练得到的文本分
文本分类方法、装置、设备及介质.pdf
本申请实施例提供了文本分类方法、装置、设备及介质,其通过将训练文本数据输入至待训练的文本分类模型,根据训练文本数据得到词嵌入向量,根据词嵌入向量进行特征提取得到文本语义特征,根据文本语义特征进行文本分类预测得到预测结果以及预测结果与标签数据之间的置信度,根据置信度计算得到损失函数,并根据损失函数调参得到已训练的文本分类模型;通过损失函数的调制因子调节头部标签和尾部标签在损失函数的占比权重,提升尾部标签的占比权重,提升文本分类模型对尾部标签分类学习的关注,加强文本分类模型对尾部标签的分类学习能力,提升文本分
文本分类模型训练、文本分类方法、装置、设备及介质.pdf
本公开提供了一种文本分类模型训练、文本分类方法、装置、设备及介质,涉及数据处理技术领域,进一步涉及深度学习和云计算等人工智能技术,包括:根据目标文本的历史存储关联数据生成目标文本样本数据;将第一目标文本样本数据输入至文本分类模型的第一文本分类器,得到第一目标文本分类结果;将第二目标文本样本数据输入至文本分类模型的第二文本分类器,得到第二目标文本分类结果;根据第一目标文本分类结果和第二目标文本分类结果确定目标文本样本数据的目标文本分类结果,以对所述文本分类模型进行训练。本公开实施例能够提高文本分类模型的分类