预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115934894A(43)申请公布日2023.04.07(21)申请号202211608314.0(22)申请日2022.12.14(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人单虹毓张祺深冯媛媛卢宏亮(74)专利代理机构北京永新同创知识产权代理有限公司11376专利代理师林锦辉刘景峰(51)Int.Cl.G06F16/33(2019.01)G06F40/30(2020.01)G06F40/289(2020.01)G06F40/247(2020.01)权利要求书3页说明书13页附图8页(54)发明名称用于语义搜索的语义相似度确定和语义搜索方法及装置(57)摘要本说明书的实施例提供了一种用于语义搜索的语义相似度确定方法及装置。在该用于确定语义相似度的方法中,将获取的待查询文本的各个分词的语义特征向量和参考文本的各个分词的语义特征向量分别提供给多类目语义特征向量生成模型,得到该待查询文本和该参考文本在各个类目下的类目语义特征向量;从该待查询文本的类目语义特征向量中选择具有最强搜索意图的第一类目语义特征向量以及从该参考文本的类目语义特征向量中选择该第一类目语义特征向量所在类目下的第二类目语义特征向量;以及根据该第一类目语义特征向量和该第二类目语义特征向量,确定该待查询文本和该参考文本之间的语义相似度。CN115934894ACN115934894A权利要求书1/3页1.一种用于语义搜索的语义相似度确定方法,包括:获取待查询文本的各个分词的语义特征向量和参考文本的各个分词的语义特征向量;将所述待查询文本的各个分词的语义特征向量和所述参考文本的各个分词的语义特征向量分别提供给多类目语义特征向量生成模型,得到所述待查询文本和所述参考文本在各个类目下的类目语义特征向量;从所述待查询文本的类目语义特征向量中选择具有最强搜索意图的第一类目语义特征向量以及从所述参考文本的类目语义特征向量中选择所述第一类目语义特征向量所在类目下的第二类目语义特征向量;以及根据所述第一类目语义特征向量和所述第二类目语义特征向量,确定所述待查询文本和所述参考文本之间的语义相似度。2.如权利要求1所述的语义相似度确定方法,其中,所述多类目语义特征向量生成模型包括多个子模型,每个子模型对应一个类目,所述将所述待查询文本的各个分词的语义特征向量和所述参考文本的各个分词的语义特征向量分别提供给多类目语义特征向量生成模型,得到所述待查询文本和所述参考文本在各个类目下的类目语义特征向量包括:将所述待查询文本的各个分词的语义特征向量和所述参考文本的各个分词的语义特征向量分别提供给各个子模型,得到所述待查询文本和所述参考文本在各个类目下的类目语义特征向量。3.如权利要求2所述的语义相似度确定方法,其中,所述子模型还包括基于动态路由机制的胶囊网络,所述将所述待查询文本的各个分词的语义特征向量和所述参考文本的各个分词的语义特征向量分别提供给各个子模型,得到所述待查询文本和所述参考文本在各个类目下的类目语义特征向量包括:分别基于动态路由机制将所述待查询文本的各个分词的语义特征向量和所述参考文本的各个分词的语义特征向量提供给各个胶囊,得到所述待查询文本和所述参考文本在各个类目下的类目语义特征向量。4.如权利要求2所述的语义相似度确定方法,其中,每个子模型包括基于双曲正切函数的挤压处理层。5.如权利要求1所述的语义相似度确定方法,其中,所述获取待查询文本的各个分词的语义特征向量和参考文本的各个分词的语义特征向量包括:将待查询文本的各个分词和参考文本的各个分词分别提供给基于Transformers的双向编码器,得到所述待查询文本的各个分词的语义特征向量和所述参考文本的各个分词的语义特征向量。6.如权利要求1到5中任一所述的语义相似度确定方法,其中,所述多类目语义特征向量生成模型在模型训练过程中采用的损失函数基于输入的样本文本对所得到的第一类目语义特征向量和第二类目语义特征向量之间的语义相似度与所述样本文本对对应的相似度标签之间的差异得到。7.一种语义搜索方法,包括:接收用户提供的待查询文本;2CN115934894A权利要求书2/3页根据如权利要求1到6中任一所述的语义相似度确定方法,确定所述待查询文本和参考文本集中的各个参考文本之间的语义相似度;基于所述待查询文本和各个参考文本之间的语义相似度,从所述参考文本集中确定出语义搜索结果;以及将所述语义搜索结果提供给所述用户。8.如权利要求7所述的语义搜索方法,其中,所述语义搜索方法应用于服务搜索,以及各个类目包括各个服务类目。9.一种用于语义搜索的语义相似度确定装置,包括:向量获取单元,被配置为获取待查询