业务模型的训练和确定文本分类类别的方法及装置.pdf
青团****青吖
亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
业务模型的训练和确定文本分类类别的方法及装置.pdf
本说明书实施例提供一种业务模型的训练方法及装置,以及确定文本分类类别的方法及装置。具体实施时,一方面,将文本用编码网络处理,得到相应的语义向量,另一方面,将分类类别按照层级关系建立关系网络,并通过图神经网络处理该关系网络,以融合节点之间的信息,得到类别表达向量。然后,将文本的语义向量和类别表达向量相融合,确定分类类别的预测结果。在业务模型训练阶段,可以将该预测结果与样本标签进行对比,以确定损失并调整模型参数,在利用训练好的业务模型确定文本分类类别的阶段,则可以根据预测结果与确定相应的分类类别。这种实施方式
文本分类模型的训练方法、文本分类方法、装置和设备.pdf
本申请提供一种文本分类模型的训练方法、文本分类方法、装置和设备,该方法包括:获取多条浏览器的历史弹窗内的文本信息;对每个文本信息进行分词处理,根据分词结果确定出每个文本信息对应的第一特征向量;对第一特征向量进行聚类,得到至少一个文本信息组;从每个文本信息组中,分别选出至少一条目标文本信息,并对每个目标文本信息添加类型标识,以形成至少一个文本信息模板;根据至少一个文本信息模板,对初始文本分类模型进行训练,得到文本分类模型。通过该方法,能够解决现有技术中无法对浏览器弹窗日志进行分析的问题,基于训练得到的文本分
模型训练方法、文本行确定方法及装置.pdf
本申请实施例提供了一种模型训练方法、装置、电子设备及存储介质。所述方法包括:获取第一样本图像和第二样本图像,所述第一样本图像和所述第二样本图像均为包含文本行的样本图像,所述第一样本图像为模拟的含有多种文本字体的图像;基于所述第一样本图像对待训练字体识别模型进行训练,得到预训练字体识别模型;基于所述第一样本图像和所述第二样本图像对所述预训练字体识别模型进行训练,得到目标字体识别模型。本申请实施例可以提高字体识别模型的识别效果,准确区分图像内的台词文本行和非台词文本行。
数据处理、文本分类模型的训练、文本分类方法和装置.pdf
本说明书实施例提供一种数据处理方法和装置、文本分类模型的训练方法和装置,以及文本分类方法和装置,将第一待处理文本信息划分为N组,根据其中N‑1组训练文本信息训练第一文本分类模型,并通过所述第一文本分类模型对剩余第一待处理文本信息进行预测,获取所述剩余第一待处理文本信息的预测类别,根据所述剩余第一待处理文本信息的预测类别与真实类别对所述剩余第一待处理文本信息进行过滤,以从所述剩余第一待处理文本信息中获取训练文本信息。通过本说明书实施例方案,能够从大量的第一待处理文本信息中自动过滤掉低质量数据,得到高质量的训
业务数据分类模型的训练、业务数据的分类方法和装置.pdf
本发明公开了业务数据分类模型的训练、业务数据的分类方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:利用多个业务数据样本构建样本集,其中,样本集中的一个样本包括一个业务数据样本的样本特征以及对应的处理类别;基于样本集划分出训练样本集和测试样本集;利用训练样本集中的样本特征和对应的处理类别,训练分类模型,得到数据分类模型;利用测试样本集中的样本特征和对应的处理类别,测试数据分类模型,并根据测试的结果,为数据分类模型修正分类阈值。该实施方式能够比较准确的为业务数据进行分类,从而更准确、高效地完成业务