预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111061954A(43)申请公布日2020.04.24(21)申请号201911319353.7(22)申请日2019.12.19(71)申请人腾讯音乐娱乐科技(深圳)有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人尹吉澧周蓝珺潘树燊(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人宁立存(51)Int.Cl.G06F16/9535(2019.01)G06F16/438(2019.01)权利要求书4页说明书16页附图4页(54)发明名称搜索结果排序方法、装置及存储介质(57)摘要本申请公开了一种搜索结果排序方法、装置及存储介质,属于数据处理领域。所述方法包括:基于多个正样本数据和多个负样本数据进行训练,得到评估模型;确定搜索关键词、与搜索关键词相关的多个搜索结果、以及每个搜索结果的统计特征,基于搜索关键词、与搜索关键词相关的多个搜索结果、以及每个搜索结果的统计特征,通过评估模型,确定多个搜索结果中每个搜索结果与搜索关键词的相关度,基于与搜索关键词的相关度,对多个搜索结果进行排序。本申请通过结合搜索关键词、与搜索关键词相关的多个搜索结果、以及每个搜索结果的统计特征来评估搜索结果与搜索关键词的相关度,能够使得对相关性的评估更加准确,进而提高了排序的准确度。CN111061954ACN111061954A权利要求书1/4页1.一种搜索结果排序方法,其特征在于,所述方法包括:获取多个第一正样本数据和多个第一负样本数据;基于所述多个第一正样本数据中每个第一正样本数据包括的多个正样本搜索结果的浏览时长,将每个第一正样本数据包括的多个正样本搜索结果的第一正样本标签划分为k档,得到每个第一正样本数据包括的多个正样本搜索结果的第二正样本标签,所述k为大于1的整数;将每个第一正样本数据包括的第一样本搜索关键词、与所述第一样本搜索关键词相关的多个正样本搜索结果、以及每个正样本搜索结果的统计特征和第二正样本标签,确定为一个第二正样本数据,得到多个第二正样本数据;对于所述多个第一负样本数据中的参考第一负样本数据,基于与所述多个第二正样本数据中每个第二正样本数据包括的多个正样本搜索结果的浏览时长,以及所述参考第一负样本数据包括的多个负样本搜索结果的搜索结果时长,确定所述参考第一负样本数据对应的采样比例,所述参考第一负样本数据为所述多个第一负样本数据中的任一个;按照所述参考第一负样本数据对应的采样比例,对所述参考第一负样本数据包括的多个负样本搜索结果进行采样;基于采样结果,确定所述参考第一负样本数据对应的第二负样本数据;将所述多个第二正样本数据,以及所述多个第一负样本数据分别对应的第二负样本数据,确定为多个样本数据;基于所述多个样本数据,对待训练评估模型进行训练,得到评估模型;确定搜索关键词、与所述搜索关键词相关的多个搜索结果、以及每个搜索结果的统计特征,所述统计特征包括在历史时间段内基于所述搜索关键词进行搜索关联到的对应搜索结果的用户浏览行为特征;基于所述搜索关键词、与所述搜索关键词相关的多个搜索结果、以及每个搜索结果的统计特征,通过所述评估模型,确定所述多个搜索结果中每个搜索结果与所述搜索关键词的相关度;基于与所述搜索关键词的相关度,对所述多个搜索结果进行排序。2.如权利要求1所述的方法,其特征在于,所述确定每个搜索结果的统计特征,包括:对于所述多个搜索结果中的任一搜索结果,从与历史搜索关键词相关的各个历史搜索结果的统计特征中,获取所述任一搜索结果的统计特征,所述历史搜索关键词为所述历史时间段内的搜索事件对应的搜索关键词。3.如权利要求2所述的方法,其特征在于,确定每个搜索结果的统计特征之前,还包括:统计所述历史时间段内用户搜索的历史搜索关键词,以及与每个历史搜索关键词相关的各个历史搜索结果的浏览次数、展现次数、浏览时长和浏览满意度中的至少一种;基于与每个历史搜索关键词相关的各个历史搜索结果的浏览次数、展现次数、浏览时长和浏览满意度中的至少一种,确定与每个历史搜索关键词相关的各个历史搜索结果的统计特征。4.如权利要求3所述的方法,其特征在于,所述统计与每个历史搜索关键词相关的各个历史搜索结果的浏览满意度,包括:对于所述历史时间段内用户搜索的任一历史搜索关键词,确定基于所述任一历史搜索2CN111061954A权利要求书2/4页关键词进行搜索关联到的多个历史搜索结果;确定所述多个历史搜索结果中每个历史搜索结果的浏览时长,所述浏览时长是指用户基于搜索行为浏览对应历史搜索结果的时长;对于所述多个历史搜索结果中的任一历史搜索结果,将所述任一历史搜索结果的浏览时长与所述多个历史搜索结果的最大浏览时长之间的比值,确定为所述