唱歌状态识别方法及装置-豆柴文库

唱歌状态识别方法及装置.pdf

2023-12-03

10金币

995KB

21页

书錦****by

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共21页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111263183A(43)申请公布日2020.06.09(21)申请号202010120653.9H04N21/258(2011.01)(22)申请日2020.02.26(71)申请人腾讯音乐娱乐科技（深圳）有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人杨跃董治李深远(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人张所明(51)Int.Cl.H04N21/2187(2011.01)H04N21/4788(2011.01)H04N21/845(2011.01)H04N21/234(2011.01)H04N21/233(2011.01)权利要求书2页说明书12页附图6页(54)发明名称唱歌状态识别方法及装置(57)摘要本申请公开了一种唱歌状态识别方法及装置，属于视频直播领域。该方法包括接收主播客户端发送的视频流，每隔预设切片时长切分视频流，获取预设切片时长的视频片段；获取目标数量个视频片段，将在目标数量个视频片段之后获取到的每个视频片段，与在视频片段之前获取到的目标数量个视频片段合成，得到一个目标视频文件；提取目标视频文件的综合特征；采用分类器对综合特征进行处理并输出处理结果，该处理结果用于指示主播用户的唱歌状态。本申请服务器可以基于分类器确定主播用户是否处于唱歌状态，提高了对主播用户的唱歌状态确定的可靠性以及准确度。CN111263183ACN111263183A权利要求书1/2页1.一种唱歌状态识别方法，其特征在于，所述方法包括：接收主播客户端发送的视频流，每隔预设切片时长切分所述视频流，获取所述预设切片时长的视频片段；获取目标数量个所述视频片段，将在所述目标数量个视频片段之后获取到的每个所述视频片段，与在所述视频片段之前获取到的所述目标数量个视频片段合成，得到一个目标视频文件，所述目标视频文件时间长度为固定值；提取所述目标视频文件的综合特征，所述综合特征包括音频特征，音频文本特征，及图像特征；采用分类器对所述综合特征进行处理并输出处理结果，所述处理结果用于指示所述主播用户的唱歌状态。2.根据权利要求1所述的方法，其特征在于，所述在获取到目标数量个所述视频片段后，将后续获取到的每个所述视频片段与在所述视频片段之前获取到的所述目标数量个视频片段合成，得到一个目标视频文件，包括：按照所述预设切片时长内每个所述视频片段的接收时间顺序，将所述视频片段的索引存储至索引文件中；获取到目标数量个视频片段，且将在目标数量个所述视频片段之后获取到的一个视频片段的索引存储至所述索引文件后，将所述索引文件中所记录的多个索引所指示的多个视频片段合成，得到一个目标视频文件；若再次获取到一个视频片段，删除所述索引文件中记录的第一个索引，并将再次获取到的所述一个视频片段的索引存储至所述索引文件中。3.根据权利要求1所述的方法，其特征在于，在接收主播客户端发送的视频流之前，所述方法还包括：获取多个样本视频文件，每个所述样本视频文件包括多个视频片段样本；提取每个所述样本视频文件的综合特征样本，得到多个所述综合特征样本；对多个所述综合特征样本和多个所述综合特征样本的属性信息进行训练得到分类器，所述属性信息用于标识所述样本视频文件中的主播用户是否为唱歌状态。4.根据权利要求1至3任一所述的方法，其特征在于，所述方法还包括：基于在第一时长内确定的所述主播用户的多个唱歌状态，确定所述主播用户的第一用户标签，所述第一用户标签用于指示所述主播用户的唱歌频率，所述多个唱歌状态根据在所述第一时长内获取到的多个所述目标视频文件得到；在视频直播客户端的显示页面显示所述主播用户的第一用户标签。5.根据权利要求4所述的方法，其特征在于，在确定所述主播用户的用户标签之后，所述方法还包括：获取在第二时长内观看用户的历史观看记录；基于所述历史观看记录确定所述观看用户的第二用户标签，所述第二用户标签用于指示所述观看用户观看唱歌视频的频率；基于各个所述主播用户的第一用户标签和所述观看用户的第二用户标签，从各个所述主播用户中确定至少一个推荐主播用户；向所述视频直播客户端推荐所述至少一个推荐主播用户的直播视频。2CN111263183A权利要求书2/2页6.根据权利要求5所述的方法，其特征在于，所述向所述视频直播客户端推荐所述至少一个备选主播用户的直播视频，包括：将所述观看用户的第二用户标签和所述至少一个推荐主播用户的标识输入排序模型；根据所述排序模型输出的排序结果，向所述视频直播客户端推荐所述至少一个推荐主播用户的直播视频。7.一种唱歌状态识别装置，其特征在于，所述装置包括：第一获取模块，用于接收主播客户端发送的视频流，每隔预设切片时长切分所述视频流，

相关资料

唱歌状态识别方法及装置.pdf

本申请公开了一种唱歌状态识别方法及装置，属于视频直播领域。该方法包括接收主播客户端发送的视频流，每隔预设切片时长切分视频流，获取预设切片时长的视频片段；获取目标数量个视频片段，将在目标数量个视频片段之后获取到的每个视频片段，与在视频片段之前获取到的目标数量个视频片段合成，得到一个目标视频文件；提取目标视频文件的综合特征；采用分类器对综合特征进行处理并输出处理结果，该处理结果用于指示主播用户的唱歌状态。本申请服务器可以基于分类器确定主播用户是否处于唱歌状态，提高了对主播用户的唱歌状态确定的可靠性以及准确度。

2023-12-03

995KB

移动状态识别方法、装置和系统.pdf

本发明实施例提供了一种移动状态识别方法、装置和系统，所述方法包括：获取第一设备接收到的声波信号，该声波信号为第二设备以固定频率发出，并被第一设备接收到的声波信号；第一设备与第二设备相互分离；根据第一设备接收到的声波信号的频率变化，确定第一设备相对第二设备的移动状态。本发明可实现快速识别两事物之间的相对移动状态。

2023-12-06

698KB

状态识别方法、装置、设备及存储介质.pdf

本公开提供了一种状态识别方法、装置、电子设备及存储介质，该方法包括：获取分别部署在多个展示区域的摄像设备采集的视频画面；基于采集的视频画面，识别出现在视频画面中的目标用户的状态数据；状态数据包括目标用户分别在各个展示区域的停留状态、关注状态以及情绪状态中的至少两种；基于目标用户的状态数据，控制终端设备显示用于描述目标用户分别在各个展示区域的状态数据的显示画面。

2023-11-14

811KB

炉口开闭状态识别方法及装置.pdf

本申请实施例提供了一种炉口开闭状态识别方法及装置，属于计算机视觉技术领域。其中方法包括：获取最新炉口图像的原始直方图，获取原始直方图与烟气图像直方图之间的图像距离；若所述图像距离小于预设距离阈值，则采用基于暗通道的图像去雾算法对所述最新炉口图像进行去烟处理，得到去烟炉口图像；对所述去烟炉口图像进行直方图均衡化处理，得到均衡化炉口图像；从所述去烟炉口图像提取多个特征区域；从多个所述特征区域中确定平均灰度值最大的目标特征区域；根据所述目标特征区域的灰度信息对炉口开闭状态进行识别。这样，通过机器视觉分析技术，自

2023-06-15

1.3MB

车辆状态的识别方法、装置、设备及存储介质.pdf

本申请提供一种车辆状态的识别方法、装置、设备及存储介质，该方法包括：获取第一通信数据集，第一通信数据集包括M个通信数据，M个通信数据与M个测量时间一一对应，M个通信数据中每个通信数据用于指示目标车辆在对应测量时间的服务小区以及目标车辆在对应测量时间所在时间段内的位置区，M为正整数；根据目标车辆在M个测量时间的服务小区和位置区的变化情况确定目标车辆在M个测量时间的运动状态，从而实现提高对车辆状态识别的准确率的目的。

2023-07-24

700KB