预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共40页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114564634A(43)申请公布日2022.05.31(21)申请号202011362117.6(22)申请日2020.11.27(71)申请人腾讯科技(深圳)有限公司地址518057广东省深圳市南山区高新区科技中一路腾讯大厦35层(72)发明人云伟标(74)专利代理机构北京市柳沈律师事务所11105专利代理师王娟(51)Int.Cl.G06F16/9535(2019.01)G06F40/216(2020.01)G06F40/30(2020.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书4页说明书24页附图11页(54)发明名称搜索请求处理方法及设备(57)摘要公开了一种搜索请求处理方法、展示搜索结果的方法、用于搜索请求处理的装置、搜索请求处理设备、展示搜索结果的设备和计算机可读存储介质。本公开利用人工智能技术识别并删除搜索请求中的不必要的词语来处理搜索请求,从而使得搜索引擎能够返回更多、更准确的搜索结果。相比于将搜索请求中的一部搜索词语随机删除的方法而言,能够保留搜索请求中的核心内容,提高搜索请求能够召回的搜索结果的数量和质量。CN114564634ACN114564634A权利要求书1/4页1.一种搜索请求处理方法,包括:基于所述搜索请求,获取所述搜索请求对应的搜索词序列,所述搜索词序列包括多个搜索词;对于所述搜索词序列中的每个搜索词,基于所述搜索词对于所述搜索请求的重要程度、所述搜索词与所述搜索词序列中的其他搜索词的关联关系、所述搜索词的语义信息中的至少一项,计算所述搜索词对应的特征向量;基于所述搜索词序列中的每个搜索词对应的特征向量,确定所述搜索词是否是所述搜索请求的非核心搜索词;以及在所述搜索词序列中删除作为非核心搜索词的搜索词,以生成更新后的搜索词序列。2.如权利要求1所述的搜索请求处理方法,其中,所述计算所述搜索词对应的特征向量还包括:确定由包括所述搜索词的历史搜索请求组成的历史搜索请求集合;计算所述历史搜索请求集合中的每个历史搜索请求对应的历史搜索结果的历史点击次数、以及所述历史搜索请求集合中的所有历史搜索请求对应的历史搜索结果的历史点击总数;计算所述历史搜索请求集合中的每个历史搜索请求的点击比例,所述点击比例为所述历史搜索请求对应的历史搜索结果的历史点击次数占所述历史点击总数的比例;基于所述历史搜索请求集合中的每个历史搜索请求对应的历史搜索结果的历史点击次数,计算所述历史搜索请求集合中的每个历史搜索请求与所述历史搜索请求集合中的其它历史搜索请求之间的相似度;基于所述点击比例和所述相似度,计算表征所述搜索词的重要程度的第一特征向量。3.如权利要求1或2所述的搜索请求处理方法,其中,所述计算所述搜索词对应的特征向量还包括:确定包括所述搜索词的历史搜索请求的第一数量;确定包括所述搜索词和其它搜索词的历史搜索请求的第二数量;基于第一数量和第二数量,计算表征所述搜索词与所述搜索词序列中的其他搜索词之间的关联关系的第二特征向量。4.如权利要求1所述的搜索请求处理方法,其中,所确定所述搜索词序列中的至少一个搜索词是否是所述搜索请求的非核心搜索词还包括:利用核心搜索词识别模型来确定所述搜索词序列中的至少一个搜索词是否是所述搜索请求的非核心搜索词;其中,所述核心搜索词识别模型的输入为所述搜索词序列中的每个搜索词对应的特征向量,输出为所述搜索词序列中的每个搜索词是否是核心搜索词的判断结果;其中,所述核心搜索词模型在训练过程中融合了历史搜索请求样本的历史点击率。5.如权利要求4所述的搜索请求处理方法,其中,所述核心搜索词识别模型的训练样本集的构建包括:获取历史搜索请求样本集以及所述历史搜索请求样本集中的每个历史搜索样本对应的历史搜索词序列,所述历史搜索词序列包括多个历史搜索词并且所述历史搜索词序列对应的搜索结果的数量为零;2CN114564634A权利要求书2/4页对于每个历史搜索词序列,确定所述历史搜索词序列的至少一个子集;确定所述至少一个子集中的每个子集组成的候选搜索词序列所对应的历史搜索结果的历史点击次数;基于所述至少一个子集中的每个子集对应的历史点击次数,确定所述历史搜索请求样本的标注结果,所述标注结果指示所述历史搜索词序列中的每个历史搜索词对于所述历史搜索请求是否是非核心历史搜索词。6.如权利要求4所述的搜索请求处理方法,其中,所述核心搜索词识别模型包括双向长短时记忆网络,所述双向长短时记忆网络的输入为由所述搜索词序列中的每个搜索词对应的特征向量组成的特征向量集合,所述双向长短时记忆网络的输出为所述搜索词序列的标注得分,所述标注得分包括所述搜索词序列中的每个搜索词是所述搜索请求的核心搜索词的得分以及所述搜索词是所述搜