预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109862393A(43)申请公布日2019.06.07(21)申请号201910216297.8H04N21/466(2011.01)(22)申请日2019.03.20G06N3/04(2006.01)G06N3/08(2006.01)(71)申请人深圳前海微众银行股份有限公司地址518052广东省深圳市南山区沙河西路1819号深圳湾科技生态园7栋A座(72)发明人裴勇郑文琛杨强(74)专利代理机构深圳市世纪恒程知识产权代理事务所44287代理人胡海国(51)Int.Cl.H04N21/234(2011.01)H04N21/233(2011.01)H04N21/44(2011.01)H04N21/439(2011.01)H04N21/81(2011.01)权利要求书2页说明书13页附图3页(54)发明名称视频文件的配乐方法、系统、设备及存储介质(57)摘要本发明公开了一种视频文件的配乐方法、系统、设备及存储介质,该方法包括:从待配乐的初始视频文件中提取出所述初始视频文件的各项视频特征,并结合各项所述视频特征生成所述初始视频文件的配乐音频文件;基于所述初始视频文件和配乐音频文件,生成测试视频文件;根据所述测试视频文件收看对象的用户画像模型和评价参数,对所述测试视频文件中配乐音频文件进行修正,生成待用视频文件。本发明降低了视频配乐的整体成本,并结合视频内容特征和用户反馈,进行视频配乐,使用户在收看视频时能够获得更好的体验。CN109862393ACN109862393A权利要求书1/2页1.一种视频文件的配乐方法,其特征在于,所述视频文件的配乐方法包括以下步骤:从待配乐的初始视频文件中提取出所述初始视频文件的各项视频特征,并结合各项所述视频特征生成所述初始视频文件的配乐音频文件;基于所述初始视频文件和配乐音频文件,生成测试视频文件;根据所述测试视频文件收看对象的用户画像模型和评价参数,对所述测试视频文件中配乐音频文件进行修正,生成待用视频文件。2.如权利要求1所述的视频文件的配乐方法,其特征在于,所述视频特征包括:光流强度特征、色度直方图特征、shot边界特征,所述从待配乐的初始视频文件中提取出所述视频文件的各项视频特征的步骤包括:提取所述初始视频文件中各视频图像对应的各光流图,和所述视频图像的色度直方图;将各所述光流图的平均光流强度作为所述初始视频文件的光流强度特征;将所述色度直方图进行归一化处理之后,作为所述初始视频文件的色度直方图特征;检测所述视频图像的shot边界,将所述shot边界所述初始视频文件的shot边界特征。3.如权利要求1所述的视频文件的配乐方法,其特征在于,所述视频特征还包括:视频情感分数特征,所述从待配乐的初始视频文件中提取出所述视频文件的各项视频特征的步骤还包括:读取所述初始视频文件的视频内容,检测并统计所述视频内容中标识视频情感的情感数据;将所述情感数据输入至预设情感分析模型,以供所述预设情感分析模型对所述情感数据进行预测得到所述视频内容的情感分数;将所述情感分数作为所述初始视频文件的视频情感分数特征。4.如权利要求1至3任一项所述的视频文件的配乐方法,其特征在于,结合各项所述视频特征生成所述初始视频文件的配乐音频文件的步骤包括:将各项所述视频特征输入至预设配乐模型,所述预设配置模型通过添加的预设训练样本进行学习训练,所述预设训练样本包括:音视频数据和纯音频数据;在所述预设配乐模型中,结合各项所述视频特征生成所述初始视频文件的配乐音频文件。5.如权利要求4所述的视频文件的配乐方法,其特征在于,在所述将各项所述视频特征输入至预设配乐模型的步骤之前,所述方法还包括:检测所述初始视频文件的lookback特征,并将所述lookback特征输入至所述预设配乐模型。6.如权利要求4所述的视频文件的配乐方法,其特征在于,所述预设配乐模型为基于序列神经网络生成音频文件的配乐模型,在所述预设配乐模型中,结合各项所述视频特征生成所述初始视频文件的配乐音频文件的步骤包括:根据所述初始视频文件的各项所述视频特征和所述lookback特征,生成音符序列;将所述音符序列输入音符时长序列神经网络,以供所述音符时长神经网络根据所述音符序列和所述lookback特征输出音符时长序列;2CN109862393A权利要求书2/2页将所述音符序列输入鼓点序列神经网络,以供所述鼓点序列神经网络根据所述音符序列输出鼓点组合;根据所述音符序列、音符时长序列和所述鼓点组合,生成所述初始视频文件的配乐音频文件。7.如权利要求1所述的视频文件的配乐方法,其特征在于,基于所述初始视频文件和配乐音频文件,生成测试视频文件的步骤包括:读取所述初始视频文件和所述配乐音频文件的播放