业务模型的训练和确定文本分类类别的方法及装置-豆柴文库

业务模型的训练和确定文本分类类别的方法及装置.pdf

2023-05-25

10金币

1.2MB

25页

青团****青吖

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共25页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111737474A(43)申请公布日2020.10.02(21)申请号202010691951.3(22)申请日2020.07.17(71)申请人支付宝（杭州）信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人金铭民(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人陈霁周良玉(51)Int.Cl.G06F16/35(2019.01)G06F40/30(2020.01)G06N3/04(2006.01)权利要求书4页说明书16页附图4页(54)发明名称业务模型的训练和确定文本分类类别的方法及装置(57)摘要本说明书实施例提供一种业务模型的训练方法及装置，以及确定文本分类类别的方法及装置。具体实施时，一方面，将文本用编码网络处理，得到相应的语义向量，另一方面，将分类类别按照层级关系建立关系网络，并通过图神经网络处理该关系网络，以融合节点之间的信息，得到类别表达向量。然后，将文本的语义向量和类别表达向量相融合，确定分类类别的预测结果。在业务模型训练阶段，可以将该预测结果与样本标签进行对比，以确定损失并调整模型参数，在利用训练好的业务模型确定文本分类类别的阶段，则可以根据预测结果与确定相应的分类类别。这种实施方式可以提高文本分类准确度。CN111737474ACN111737474A权利要求书1/4页1.一种业务模型的训练方法，所述业务模型包括编码网络、融合层、全连接层，用于确定文本分类类别，所述方法包括：从训练样本集中获取第一文本，所述第一文本对应有文本标签，所述文本标签从多个候选类别中确定；利用所述编码网络处理所述第一文本，得到第一语义向量；经由图神经网络处理类别层级关系网络，得到各个候选类别分别对应的各个类别表达向量，所述类别层级关系网络包括与各个候选类别一一对应的各个节点，具有直接上下级关系的候选类别之间由连接边连接，各个节点分别对应有相应类别特征向量作为初始的节点表达向量，所述图神经网络用于对各个节点分别进行邻居节点的节点表达向量聚合，以更新相应的节点表达向量，各个类别表达向量分别为经所述图神经网络最后一层更新后的相应节点表达向量；经由所述融合层，基于所述第一语义向量融合各个类别表达向量，得到针对所述第一文本的第一融合向量；通过所述全连接层，基于所述第一融合向量与所述第一语义向量，得到针对所述第一文本所属分类类别的第一预测结果；以所述第一预测结果与所述文本标签相一致为目标，调整所述编码网络、所述图神经网络、融合层、全连接层中的模型参数，从而训练所述业务模型。2.根据权利要求1所述的方法，其中，所述第一文本对应有多个层级的候选类别，所述文本标签是其中最低层级的候选类别。3.根据权利要求1所述的方法，其中，所述第一语义向量与所述类别表达向量的维数均为s，所述经由所述融合层，基于所述第一语义向量融合各个类别表达向量，得到针对所述第一文本的第一融合向量包括：根据所述第一语义向量与各个类别表达向量的对比，确定各个类别表达向量分别与所述第一语义向量的各个第一相似度；利用各个第一相似度对各个类别表达向量加权求和，得到所述第一融合向量，其中，各个类别表达向量的权重与相应的第一相似度正相关。4.根据权利要求1所述的方法，所述候选类别的数量为n，所述第一语义向量与所述类别表达向量的维数均为s，所述经由所述融合层，基于所述第一语义向量融合各个类别表达向量，得到针对所述第一文本的第一融合向量包括：获取与所述第一语义向量对应的s维行向量，以及由n个类别表达向量依次排列组成的s行n列的类别向量矩阵；基于所述s维行向量与所述s行n列的类别向量矩阵的乘积，确定n维的中间向量；将所述n维中间向量中的各个元素，分别作为相应候选类别的加权权重，对各个类别表达向量加权平均，得到所述第一融合向量。5.根据权利要求1所述的方法，其中，所述通过所述全连接层，基于所述第一融合向量与所述第一语义向量，得到针对所述第一文本所属分类类别的第一预测结果包括：将所述第一融合向量与所述第一语义向量拼接，得到第一拼接向量；通过所述全连接层处理所述第一拼接向量，得到所述第一预测结果。6.根据权利要求1所述的方法，其中，所述以所述第一预测结果与所述文本标签相一致2CN111737474A权利要求书2/4页为目标，调整所述编码网络、所述图神经网络、融合层、全连接层中的模型参数，从而训练所述业务模型包括：利用交叉熵的方式确定所述第一预测结果相对于所述文本标签的损失；向所述损失减小的方向调整所述编码网络、所述图神经网络、融合层、全连接层中的模型参数。7.根据权利要求1所述的方法，在初始的各个类别特征向量为随机值的情况下，所述方法还包括：以所述第一

相关资料

业务模型的训练和确定文本分类类别的方法及装置.pdf

本说明书实施例提供一种业务模型的训练方法及装置，以及确定文本分类类别的方法及装置。具体实施时，一方面，将文本用编码网络处理，得到相应的语义向量，另一方面，将分类类别按照层级关系建立关系网络，并通过图神经网络处理该关系网络，以融合节点之间的信息，得到类别表达向量。然后，将文本的语义向量和类别表达向量相融合，确定分类类别的预测结果。在业务模型训练阶段，可以将该预测结果与样本标签进行对比，以确定损失并调整模型参数，在利用训练好的业务模型确定文本分类类别的阶段，则可以根据预测结果与确定相应的分类类别。这种实施方式

2023-05-25

1.2MB

文本分类模型的训练方法、文本分类方法、装置和设备.pdf

本申请提供一种文本分类模型的训练方法、文本分类方法、装置和设备，该方法包括：获取多条浏览器的历史弹窗内的文本信息；对每个文本信息进行分词处理，根据分词结果确定出每个文本信息对应的第一特征向量；对第一特征向量进行聚类，得到至少一个文本信息组；从每个文本信息组中，分别选出至少一条目标文本信息，并对每个目标文本信息添加类型标识，以形成至少一个文本信息模板；根据至少一个文本信息模板，对初始文本分类模型进行训练，得到文本分类模型。通过该方法，能够解决现有技术中无法对浏览器弹窗日志进行分析的问题，基于训练得到的文本分

2023-07-24

655KB

模型训练方法、文本行确定方法及装置.pdf

本申请实施例提供了一种模型训练方法、装置、电子设备及存储介质。所述方法包括：获取第一样本图像和第二样本图像，所述第一样本图像和所述第二样本图像均为包含文本行的样本图像，所述第一样本图像为模拟的含有多种文本字体的图像；基于所述第一样本图像对待训练字体识别模型进行训练，得到预训练字体识别模型；基于所述第一样本图像和所述第二样本图像对所述预训练字体识别模型进行训练，得到目标字体识别模型。本申请实施例可以提高字体识别模型的识别效果，准确区分图像内的台词文本行和非台词文本行。

2023-07-21

835KB

数据处理、文本分类模型的训练、文本分类方法和装置.pdf

本说明书实施例提供一种数据处理方法和装置、文本分类模型的训练方法和装置，以及文本分类方法和装置，将第一待处理文本信息划分为N组，根据其中N‑1组训练文本信息训练第一文本分类模型，并通过所述第一文本分类模型对剩余第一待处理文本信息进行预测，获取所述剩余第一待处理文本信息的预测类别，根据所述剩余第一待处理文本信息的预测类别与真实类别对所述剩余第一待处理文本信息进行过滤，以从所述剩余第一待处理文本信息中获取训练文本信息。通过本说明书实施例方案，能够从大量的第一待处理文本信息中自动过滤掉低质量数据，得到高质量的训

2023-05-25

548KB

业务数据分类模型的训练、业务数据的分类方法和装置.pdf

本发明公开了业务数据分类模型的训练、业务数据的分类方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：利用多个业务数据样本构建样本集，其中，样本集中的一个样本包括一个业务数据样本的样本特征以及对应的处理类别；基于样本集划分出训练样本集和测试样本集；利用训练样本集中的样本特征和对应的处理类别，训练分类模型，得到数据分类模型；利用测试样本集中的样本特征和对应的处理类别，测试数据分类模型，并根据测试的结果，为数据分类模型修正分类阈值。该实施方式能够比较准确的为业务数据进行分类，从而更准确、高效地完成业务

2023-06-14

845KB