预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111263183A(43)申请公布日2020.06.09(21)申请号202010120653.9H04N21/258(2011.01)(22)申请日2020.02.26(71)申请人腾讯音乐娱乐科技(深圳)有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人杨跃董治李深远(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人张所明(51)Int.Cl.H04N21/2187(2011.01)H04N21/4788(2011.01)H04N21/845(2011.01)H04N21/234(2011.01)H04N21/233(2011.01)权利要求书2页说明书12页附图6页(54)发明名称唱歌状态识别方法及装置(57)摘要本申请公开了一种唱歌状态识别方法及装置,属于视频直播领域。该方法包括接收主播客户端发送的视频流,每隔预设切片时长切分视频流,获取预设切片时长的视频片段;获取目标数量个视频片段,将在目标数量个视频片段之后获取到的每个视频片段,与在视频片段之前获取到的目标数量个视频片段合成,得到一个目标视频文件;提取目标视频文件的综合特征;采用分类器对综合特征进行处理并输出处理结果,该处理结果用于指示主播用户的唱歌状态。本申请服务器可以基于分类器确定主播用户是否处于唱歌状态,提高了对主播用户的唱歌状态确定的可靠性以及准确度。CN111263183ACN111263183A权利要求书1/2页1.一种唱歌状态识别方法,其特征在于,所述方法包括:接收主播客户端发送的视频流,每隔预设切片时长切分所述视频流,获取所述预设切片时长的视频片段;获取目标数量个所述视频片段,将在所述目标数量个视频片段之后获取到的每个所述视频片段,与在所述视频片段之前获取到的所述目标数量个视频片段合成,得到一个目标视频文件,所述目标视频文件时间长度为固定值;提取所述目标视频文件的综合特征,所述综合特征包括音频特征,音频文本特征,及图像特征;采用分类器对所述综合特征进行处理并输出处理结果,所述处理结果用于指示所述主播用户的唱歌状态。2.根据权利要求1所述的方法,其特征在于,所述在获取到目标数量个所述视频片段后,将后续获取到的每个所述视频片段与在所述视频片段之前获取到的所述目标数量个视频片段合成,得到一个目标视频文件,包括:按照所述预设切片时长内每个所述视频片段的接收时间顺序,将所述视频片段的索引存储至索引文件中;获取到目标数量个视频片段,且将在目标数量个所述视频片段之后获取到的一个视频片段的索引存储至所述索引文件后,将所述索引文件中所记录的多个索引所指示的多个视频片段合成,得到一个目标视频文件;若再次获取到一个视频片段,删除所述索引文件中记录的第一个索引,并将再次获取到的所述一个视频片段的索引存储至所述索引文件中。3.根据权利要求1所述的方法,其特征在于,在接收主播客户端发送的视频流之前,所述方法还包括:获取多个样本视频文件,每个所述样本视频文件包括多个视频片段样本;提取每个所述样本视频文件的综合特征样本,得到多个所述综合特征样本;对多个所述综合特征样本和多个所述综合特征样本的属性信息进行训练得到分类器,所述属性信息用于标识所述样本视频文件中的主播用户是否为唱歌状态。4.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:基于在第一时长内确定的所述主播用户的多个唱歌状态,确定所述主播用户的第一用户标签,所述第一用户标签用于指示所述主播用户的唱歌频率,所述多个唱歌状态根据在所述第一时长内获取到的多个所述目标视频文件得到;在视频直播客户端的显示页面显示所述主播用户的第一用户标签。5.根据权利要求4所述的方法,其特征在于,在确定所述主播用户的用户标签之后,所述方法还包括:获取在第二时长内观看用户的历史观看记录;基于所述历史观看记录确定所述观看用户的第二用户标签,所述第二用户标签用于指示所述观看用户观看唱歌视频的频率;基于各个所述主播用户的第一用户标签和所述观看用户的第二用户标签,从各个所述主播用户中确定至少一个推荐主播用户;向所述视频直播客户端推荐所述至少一个推荐主播用户的直播视频。2CN111263183A权利要求书2/2页6.根据权利要求5所述的方法,其特征在于,所述向所述视频直播客户端推荐所述至少一个备选主播用户的直播视频,包括:将所述观看用户的第二用户标签和所述至少一个推荐主播用户的标识输入排序模型;根据所述排序模型输出的排序结果,向所述视频直播客户端推荐所述至少一个推荐主播用户的直播视频。7.一种唱歌状态识别装置,其特征在于,所述装置包括:第一获取模块,用于接收主播客户端发送的视频流,每隔预设切片时长切分所述视频流,