预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113761188A(43)申请公布日2021.12.07(21)申请号202110412379.7G06F40/30(2020.01)(22)申请日2021.04.16(71)申请人腾讯科技(深圳)有限公司地址518000广东省深圳市南山区高新区科技中一路腾讯大厦35层(72)发明人吴焕钦刘维(74)专利代理机构广州华进联合专利商标代理有限公司44224代理人毛丹(51)Int.Cl.G06F16/35(2019.01)G06F16/38(2019.01)G06F40/117(2020.01)G06F40/126(2020.01)G06F40/194(2020.01)权利要求书2页说明书14页附图6页(54)发明名称文本标签确定方法、装置、计算机设备和存储介质(57)摘要本申请涉及自然语言处理技术领域,提供了一种文本标签确定方法、装置、计算机设备和存储介质。所述方法包括:获取拼接文本,拼接文本包括已拼接的候选标签以及目标文本;对拼接文本中各单字进行编码,得到与各单字对应的字向量;利用注意力机制根据字向量对各单字进行交互,得到与候选标签中各单字对应的特征向量;根据特征向量对候选标签中各单字进行序列标注分类,得到候选标签中各单字对应的序列标注结果;根据序列标注结果,确定与目标文本对应的目标标签。采用本方法能够提高文本标签确定准确率。CN113761188ACN113761188A权利要求书1/2页1.一种文本标签确定方法,其特征在于,所述方法包括:获取拼接文本,所述拼接文本包括已拼接的候选标签以及目标文本;对所述拼接文本中各单字进行编码,得到与各单字对应的字向量;利用注意力机制根据所述字向量对各单字进行交互,得到与所述候选标签中各单字对应的特征向量;根据所述特征向量对所述候选标签中各单字进行序列标注分类,得到所述候选标签中各单字对应的序列标注结果;根据所述序列标注结果,确定与所述目标文本对应的目标标签。2.根据权利要求1所述的方法,其特征在于,所述利用注意力机制根据所述字向量对各单字进行交互,得到与所述候选标签中各单字对应的特征向量包括:利用注意力机制根据所述字向量计算各单字之间的相似度,得到与所述拼接文本对应的相似度矩阵;对所述相似度矩阵进行归一化,确定各单字之间的相对权重系数;根据所述相对权重系数和所述字向量进行向量加权,得到与所述候选标签中各单字对应的特征向量。3.根据权利要求1所述的方法,其特征在于,所述根据所述特征向量对所述候选标签中各单字进行序列标注分类,得到所述候选标签中各单字对应的序列标注结果包括:获取已训练的标签向量转换矩阵;根据所述特征向量和所述标签向量转换矩阵,得到与所述候选标签中各单字对应的序列标签向量;根据所述序列标签向量对所述候选标签中各单字进行序列标注分类,得到所述候选标签中各单字对应的序列标注结果。4.根据权利要求3所述的方法,其特征在于,所述根据所述序列标签向量对所述候选标签中各单字进行序列标注分类,得到所述候选标签中各单字对应的序列标注结果包括:根据所述序列标签向量对所述候选标签中各单字进行序列标注分类,确定各单字归属于各预设序列标签的类别概率;根据所述类别概率,得到所述候选标签中各单字对应的序列标注结果。5.根据权利要求1所述的方法,其特征在于,所述根据所述序列标注结果,确定与所述目标文本对应的目标标签包括:根据所述序列标注结果,确定有效序列标签;根据所述有效序列标签,从所述候选标签中筛选出与所述目标文本对应的目标标签。6.根据权利要求1所述的方法,其特征在于,权利要求1‑4中任一项中所述候选标签中各单字对应的序列标注结果通过文本标签匹配模型得到;所述文本标签匹配模型的构建过程包括:获取初始文本匹配模型以及分类匹配训练数据,所述分类匹配训练数据包括已拼接的分类标签以及与所述分类标签对应的分类匹配文本,所述分类标签携带分类序列标签;根据所述分类匹配训练数据对所述初始文本匹配模型进行训练,得到初始文本标签匹配模型;获取标签匹配训练数据,所述标签匹配训练数据包括已拼接的训练标签以及与所述训2CN113761188A权利要求书2/2页练标签匹配的标签匹配文本,所述训练标签携带训练序列标签;根据所述标签匹配训练数据对所述初始文本标签匹配模型进行训练,得到已训练的文本标签匹配模型。7.根据权利要求6所述的方法,其特征在于,所述根据所述标签匹配训练数据对所述初始文本标签匹配模型进行训练,得到已训练的文本标签匹配模型包括:根据所述标签匹配训练数据对所述初始文本标签匹配模型进行训练,得到初步训练文本标签匹配模型;根据所述分类匹配训练数据以及所述标签匹配训练数据,生成任务联合训练数据;根据所述任务联合训练数据对所述初步训练文本标签匹配