预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共28页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111090771A(43)申请公布日2020.05.01(21)申请号201911051673.9(22)申请日2019.10.31(71)申请人腾讯音乐娱乐科技(深圳)有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人程艺波郝志新潘树燊邱津(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人宁立存(51)Int.Cl.G06F16/68(2019.01)权利要求书5页说明书18页附图4页(54)发明名称歌曲搜索方法、装置及计算机存储介质(57)摘要本申请公开了一种歌曲搜索方法、装置及计算机存储介质,属于信息处理领域。所述方法包括:获取用户包含有搜索语句的歌曲搜索请求;根据语义标签词典确定搜索语句中的关键词;确定关键词与歌曲库中所有歌曲的标签词中每个标签词的匹配度;并根据关键词与歌曲库中所有歌曲的标签词中每个标签词的匹配度,从歌曲库中选取至少一首歌曲,将选取的歌曲作为歌曲搜索结果返回给用户。本申请通过获取歌曲库中的多个歌单的歌单信息,对歌单信息进行分词和筛选,得到语义标签词典。并基于语义标签词典从搜索语句中确定至少一个关键词,进而根据关键词在歌曲库中选取多首歌曲,选取的歌曲更符合用户的语义搜索意图。CN111090771ACN111090771A权利要求书1/5页1.一种歌曲搜索方法,其特征在于,所述方法包括:获取用户的歌曲搜索请求,所述歌曲搜索请求包含搜索语句;根据语义标签词典从所述搜索语句中确定至少一个关键词,所述语义标签词典中的标签词是从多个歌单的歌单信息中提取得到;确定所述至少一个关键词中的每个关键词与歌曲库中所有歌曲的标签词中每个标签词的匹配度,每首歌曲的标签词是根据所述语义标签词典从每首歌曲所属歌单的歌单信息中提取得到;根据所述至少一个关键词中的每个关键词与歌曲库中所有歌曲的标签词中每个标签词的匹配度,从所述所有歌曲的标签词中确定与所述至少一个关键词中任一关键词的匹配度满足预设匹配条件的至少一个标签词;从所述歌曲库中选取所述至少一个标签词中每个标签词对应的歌曲,将选取的歌曲作为歌曲搜索结果返回给所述用户。2.根据权利要求1所述的方法,其特征在于,所述将选取的歌曲作为歌曲搜索结果返回给所述用户,包括:根据选取的歌曲中每首歌曲与对应标签词之间的关联程度,对所述选取的歌曲进行排序,每首歌曲与对应标签词之间的关联程度用于指示根据所述每首歌曲所属的、具有所述每首歌曲对应标签词的歌单播放所述每首歌曲的概率;将排序后的歌曲作为歌曲搜索结果返回给所述用户。3.根据权利要求2所述的方法,其特征在于,所述根据选取的歌曲中每首歌曲与对应标签词之间的关联程度,对所述选取的歌曲进行排序之前,还包括:根据所述语义标签词典和所述多个歌单的歌单信息,确定每个歌单的标签词;根据所述多个歌单的标签词和每个歌单包括的歌曲,确定所述多个歌单中目标歌曲的标签词,所述目标歌曲为所述多个歌单中的任一歌曲,所述目标歌曲的标签词包括所述目标歌曲所属的每个歌单的标签词;对于所述目标歌曲的任一标签词,确定所述任一标签词所属歌单的播放量;根据所述任一标签词所属歌单的播放量,确定所述目标歌曲与所述任一标签词之间的关联程度。4.如权利要求1-3任一所述的方法,其特征在于,所述根据语义标签词典对所述搜索语句进行分词处理之前,还包括:对所述多个歌单的歌单信息进行字符切分,得到多个字符串;确定所述多个字符串中每个字符串的分词指标,所述分词指标包括词频、左右信息熵和互信息;根据所述多个字符串的分词指标,从所述多个字符串中选取满足预设分词指标条件的字符串,将选取的字符串确定为多个候选词;根据所述多个候选词,确定所述语义标签词典。5.根据权利要求4所述的方法,其特征在于,所述根据所述多个字符串的分词指标,从所述多个字符串中选取满足预设分词指标条件的字符串,将选取的字符串确定为多个候选词,包括:按照预设筛选规则,对所述多个字符串进行筛选;2CN111090771A权利要求书2/5页根据筛选后的字符串的词频,对筛选后的字符串进行分类,得到高频词集合和低频词集合;根据所述高频词集合中每个高频词的左右信息熵和互信息,从所述高频词集合中选取满足第一预设条件的高频词,以及根据所述低频词集合中每个低频词的左右信息熵和互信息,从所述低频词集合中选取满足第二预设条件的低频词;从选取的高频词和低频词中筛选掉音乐停用词和无意义分词;将筛选后的高频词和低频词,确定为所述多个候选词。6.根据权利要求5所述的方法,其特征在于,所述根据所述高频词集合中每个高频词的左右信息熵和互信息,从所述高频词集合中选取满足第一预设条件的高频词,以及根据所述低频词集合中每个低频词的左右信息熵和互