语义相似度确定方法、装置及处理设备-豆柴文库

语义相似度确定方法、装置及处理设备.pdf

2023-05-25

10金币

1MB

27页

一条****然后

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共27页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111241851A(43)申请公布日2020.06.05(21)申请号202010329730.1(22)申请日2020.04.24(71)申请人支付宝（杭州）信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人成幸毅徐威迪陈昆龙黄伟鹏蒋亮温祖杰王太峰褚崴(74)专利代理机构北京三友知识产权代理有限公司11127代理人周达刘飞(51)Int.Cl.G06F40/30(2020.01)G06F40/289(2020.01)G06K9/62(2006.01)权利要求书3页说明书17页附图6页(54)发明名称语义相似度确定方法、装置及处理设备(57)摘要本说明书提供一种语义相似度确定方法、装置及处理设备，预先建立的语义相似度模型从两个不同的角度处理句子对，既考虑了文本句子的维度，又结合了文本单词级交叉矩阵的角度。在需要对待处理文本进行语义相似度的计算时，可以直接利用建立好的语义相似度模型中的语句语义确定子模型对待处理文本分别进行语义编码，将待处理文本分别转换为向量表示，基于转换后的向量对待处理文本进行相似度计算。在确保语义相似度计算效率的基础上，提高了语义相似度计算的准确性。CN111241851ACN111241851A权利要求书1/3页1.一种语义相似度确定方法，所述方法包括：获取待处理文本；利用建立好的语义相似度模型中的语句语义确定子模型对所述待处理文本分别进行向量转换，并利用所述语句语义确定子模型根据转换后的向量进行相似度计算，获得所述语义相似度模型的输出结果；其中，所述语义相似度模型包括所述语句语义确定子模型和交叉语义确定子模型，所述语句语义确定子模型是以预训练好的所述交叉语义确定子模型输出的结果为训练目标进行模型训练构建的；根据所述语义相似度模型的输出结果，确定出所述待处理文本之间的语义相似度。2.如权利要求1所述的方法，所述语义相似度模型被设置为按照下述方法进行构建：获取第一样本数据集，所述第一样本数据集包括多个带有标签的样本数据；利用所述第一样本数据集中的样本数据以及对应的标签对所述语义相似度模型中的交叉语义确定子模型进行预训练；将第二样本数据集中的样本数据输入到预训练好的所述交叉语义确定子模型和语句语义确定子模型中，并将预训练好的交叉语义确定子模型的输出结果作为所述语句语义确定子模型训练的训练目标，对所述语句语义确定子模型进行训练，直至满足训练要求，构建出所述语义相似度模型。3.如权利要求2所述的方法，所述方法还包括：将预训练好的交叉语义确定子模型的输出结果作为所述语句语义确定子模型训练的训练软目标；将所述第二样本数据集中样本数据的标签作为所述语句语义确定子模型训练的训练硬目标；根据所述训练软目标和所述训练硬目标确定出所述语句语义确定子模型的训练目标。4.如权利要求3所述的方法，所述根据所述训练软目标和所述训练硬目标确定出所述语句语义确定子模型的训练目标，包括：根据所述训练软目标对应的软目标权重、所述训练硬目标对应的硬目标权重、所述训练软目标、所述训练硬目标确定出所述语句语义确定子模型的训练目标；其中，在所述语句语义确定子模型训练开始时，所述硬目标权重小于所述软目标权重，随着所述语句语义确定子模型的模型训练，所述软目标权重的数值递减，所述硬目标权重的数值递增。5.如权利要求4所述的方法，所述方法还包括：在所述语句语义确定子模型训练开始时，所述硬目标权重为0。6.如权利要求3-5任一项所述的方法，所述方法还包括：利用预训练好的所述交叉语义确定子模型确定所述第一样本数据集中的样本数据的计算标签；将所述计算标签添加到所述第一样本数据集中，将添加了计算标签的第一样本数据集作为所述第二样本数据集。7.如权利要求1所述的方法，所述交叉语义确定子模型有多个，各个交叉语义确定子模型的结构不同，所述语句语义确定子模型以各个训练好的交叉语义确定子模型输出的结果为训练目标进行模型训练。8.如权利要求2所述的方法，所述交叉语义确定子模型通过根据两个文本的单词级交2CN111241851A权利要求书2/3页互矩阵确定出两个文本之间的相似度语句语义确定子模型。9.一种用于语义相似度计算的模型训练构建方法，所述方法包括：获取待训练的语义相似度模型中的语句语义确定子模型和交叉语义确定子模型的模型参数；获取第一样本数据集，所述第一样本数据集包括多个带有标签的样本数据，所述样本数据为文本数据；利用所述第一样本数据集中的样本数据以及对应的标签对所述交叉语义确定子模型进行预训练，调整所述交叉语义确定子模型的模型参数；将第二样本数据集中的样本数据输入到预训练好的所述交叉语义确定子模型和所述语句语义确定子模型中，并将预训练好的交叉语义

相关资料

语义相似度确定方法、装置及处理设备.pdf

本说明书提供一种语义相似度确定方法、装置及处理设备，预先建立的语义相似度模型从两个不同的角度处理句子对，既考虑了文本句子的维度，又结合了文本单词级交叉矩阵的角度。在需要对待处理文本进行语义相似度的计算时，可以直接利用建立好的语义相似度模型中的语句语义确定子模型对待处理文本分别进行语义编码，将待处理文本分别转换为向量表示，基于转换后的向量对待处理文本进行相似度计算。在确保语义相似度计算效率的基础上，提高了语义相似度计算的准确性。

2023-05-25

1MB

用于语义搜索的语义相似度确定和语义搜索方法及装置.pdf

本说明书的实施例提供了一种用于语义搜索的语义相似度确定方法及装置。在该用于确定语义相似度的方法中，将获取的待查询文本的各个分词的语义特征向量和参考文本的各个分词的语义特征向量分别提供给多类目语义特征向量生成模型，得到该待查询文本和该参考文本在各个类目下的类目语义特征向量；从该待查询文本的类目语义特征向量中选择具有最强搜索意图的第一类目语义特征向量以及从该参考文本的类目语义特征向量中选择该第一类目语义特征向量所在类目下的第二类目语义特征向量；以及根据该第一类目语义特征向量和该第二类目语义特征向量，确定该待查

2023-05-25

1.1MB

基于图数据确定文本的语义相似度的方法及装置.pdf

本说明书实施例提供了利用图数据确定文本的语义相似度的构思，在该技术构思下，图数据中的节点对应语料库中的句子和词，相关联的句子和词、词和词之间通过连接边连接，各个节点对应有能够表达相应词或句子的语义信息的节点表达向量。在对图数据的数据预处理过程中，能够利用大量无监督数据构建图数据，来描述词和句子、词和词之间的关系，并通过少量有监督数据优化处理模型的模型参数，使得相似文本的向量表示可以相互影响，从而通过图数据对文本和词汇进行有效的向量表达。在确定文本的语义相似度时，通过图数据获取待确定语义相似度文本的向量，利

2023-05-25

1.1MB

模型相似度确定方法及装置.pdf

本说明书实施例提供一种模型相似度确定方法及装置，在模型相似度确定方法中，先利用对抗样本生成算法，针对输入图像，生成用于攻击本地图像识别模型的对抗图像，以获取一个扰动方向和扰动量。之后，沿着这个扰动方向寻找一组目标方向，其中，在每个目标方向上，对输入图像施加上述扰动量后可以对本地图像识别模型攻击成功。接着，针对一组目标方向中任意的第一方向，分别确定输入图像在该第一方向上可对第一和第二图像识别模型攻击成功时，针对输入图像所需施加的第一和第二扰动量。最后，根据针对一组目标方向中各方向分别确定的第一和第二扰动量，

2023-05-25

605KB

相似度阈值确定方法、装置、设备和存储介质.pdf

本申请公开了一种相似度阈值确定方法、装置、设备和存储介质，该方法包括：获取多张人脸图片；对多张人脸图片中的任意两张图片进行组合，得到多个图片集合，并计算每个图片集合中两张图片之间的相似度；将每个相似度分别与预设候选阈值集合中的每个候选相似度阈值进行比较，得到对应的比较结果；根据比较结果计算每个候选相似度阈值的评价指标；将评价指标达到指标阈值的候选相似度阈值确定为目标相似度阈值。本申请计算得到的目标相似度阈值，相较于现有技术根据经验设置的阈值，能够更好地适用于所有人脸图片的验证，降低分类误差，提高了分类正确

2023-07-24

900KB