预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114449252A(43)申请公布日2022.05.06(21)申请号202210130889.XG06F40/279(2020.01)(22)申请日2022.02.12(71)申请人北京蜂巢世纪科技有限公司地址100089北京市海淀区安宁庄后街南1号A区1层1022号(72)发明人刘威夏勇峰(51)Int.Cl.H04N13/344(2018.01)H04N13/398(2018.01)H04N21/442(2011.01)H04N21/475(2011.01)H04N21/488(2011.01)H04N5/232(2006.01)G10L15/08(2006.01)G10L15/22(2006.01)G10L15/26(2006.01)权利要求书2页说明书8页附图4页(54)发明名称基于解说音频的现场视频动态调整方法、装置、设备、系统和介质(57)摘要本申请涉及一种基于解说音频的现场视频动态调整方法、装置、设备、系统和介质,涉及增强现实技术的领域,其方法包括获取并播放现场活动的当前解说音频数据;识别所述当前解说音频数据的关键词信息;获取第一摄像头采集的所述现场活动的当前视频数据;基于所述关键词信息和所述当前视频数据确定是否生成提示信息,所述提示信息用于提示用户调整所述第一摄像头的角度。本申请根据提示信息转动第一摄像头使得显示设备播放的当前视频数据中的内容与当前解说音频数据中的内容达到同步,提高了用户观看体育赛事或演出的体验感。CN114449252ACN114449252A权利要求书1/2页1.一种基于解说音频的现场视频动态调整方法,其特征在于,包括:获取并播放现场活动的当前解说音频数据;识别所述当前解说音频数据的关键词信息;获取第一摄像头采集的所述现场活动的当前视频数据;基于所述关键词信息和所述当前视频数据确定是否生成提示信息,所述提示信息用于提示用户调整所述第一摄像头的角度。2.根据权利要求1所述的方法,其特征在于,所述基于所述关键词信息和所述当前视频数据确定是否生成提示信息,包括:获取所述关键词信息对应的第一目标对象,并将所述第一目标对象作为当前目标对象;判断所述当前视频数据的画面中是否存在所述当前目标对象;若否,则生成所述提示信息。3.根据权利要求2所述的方法,其特征在于,所述生成所述提示信息,包括:获取所述现场活动的直播视频流数据,基于所述直播视频流数据获取所述当前解说音频数据实时对应的活动全景画面;确定所述当前目标对象在所述活动全景画面中的位置信息;确定所述当前视频数据的画面与所述活动全景画面的相对位置关系;基于所述位置信息和所述相对位置关系生成第一摄像头角度偏移方向;基于所述第一摄像头角度偏移方向生成所述提示信息。4.根据权利要求2或3所述的方法,其特征在于,还包括:若所述当前视频数据的画面中存在所述当前目标对象,则对所述当前视频数据的画面中的所述当前目标对象进行第一标识。5.根据权利要求2或3所述的方法,其特征在于,在所述生成所述提示信息之后,还包括:判断所述当前解说音频数据中是否出现新的关键词信息;若否,则重复所述判断所述当前视频数据的画面中是否存在所述当前目标对象的步骤;若是,则将所述新的关键词信息对应的第一目标对象作为当前目标对象,并重复所述判断所述当前视频数据的画面中是否存在所述当前目标对象的步骤。6.根据权利要求1所述的方法,其特征在于,在所述获取第一摄像头采集的所述现场活动的当前视频数据之后,还包括:响应于用户选择第二目标对象的操作,对所述当前视频数据进行图像识别;若所述当前视频数据的画面中存在所述第二目标对象,则对所述当前视频数据的画面中的所述第二目标对象进行第二标识。7.一种基于解说音频的现场视频动态调整装置,其特征在于,包括:获取播放模块,用于获取并播放现场活动的当前解说音频数据;识别模块,用于识别所述当前解说音频数据的关键词信息;获取模块,用于获取第一摄像头采集的所述现场活动的当前视频数据;生成模块,用于基于所述关键词信息和所述当前视频数据确定是否生成提示信息,所2CN114449252A权利要求书2/2页述提示信息用于提示用户调整所述第一摄像头的角度。8.一种智能终端,其特征在于,包括存储器和处理器,所述存储器上存储有能够被所述处理器加载并执行如权利要求1至6中任一种方法的计算机程序。9.一种基于解说音频的现场视频动态调整系统,其特征在于,包括如权利要求8所述的智能终端以及音频播放设备、摄像设备、显示设备;所述智能终端基于网络接收现场活动的当前解说音频数据,并将当前解说音频数据发送至音频播放设备,所述音频播放设备用于对接收的解说音频进行播放;所述摄像设备用于采集现场活动的当前视频数据,并将当前视频数据发送至智能终端,智