视频生成方法、装置、设备及存储介质-豆柴文库

视频生成方法、装置、设备及存储介质.pdf

2023-07-24

10金币

791KB

18页

书錦****by

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共18页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113905177A(43)申请公布日2022.01.07(21)申请号202111154001.8H04N21/44(2011.01)(22)申请日2021.09.29(71)申请人北京字跳网络技术有限公司地址100190北京市海淀区紫金数码园4号楼2层0207(72)发明人黄佳斌(74)专利代理机构北京远智汇知识产权代理有限公司11659代理人范坤坤(51)Int.Cl.H04N5/232(2006.01)H04N5/262(2006.01)H04N5/265(2006.01)H04N5/272(2006.01)H04N21/439(2011.01)权利要求书2页说明书11页附图4页(54)发明名称视频生成方法、装置、设备及存储介质(57)摘要本公开实施例公开了一种视频生成方法、装置、设备及存储介质。获取原始图像及与原始图像相匹配的原始音频；对原始图像进行目标对象的分割，获得目标对象图像和背景图像；对原始音频进行重音识别，获得重音音频；对目标对象图像的尺寸按照不同的调整比例进行调整，获得多个调整后的目标对象图像；将多个调整后的目标对象图像分别与背景图像进行融合，获得多个目标图像；将多个目标图像与重音音频进行音视频编码，获得目标视频。本公开实施例提供的视频生成方法，将调整尺寸后的目标对象图像与重音音频进行音视频编码，获得目标视频，不仅可以提高视频生成的效率，且可以丰富生成视频的呈现效果。CN113905177ACN113905177A权利要求书1/2页1.一种视频生成方法，其特征在于，包括：获取原始图像及与所述原始图像相匹配的原始音频；对所述原始图像进行目标对象的分割，获得目标对象图像和背景图像；对所述原始音频进行重音识别，获得重音音频；对所述目标对象图像的尺寸按照不同的调整比例进行调整，获得多个调整后的目标对象图像；将所述多个调整后的目标对象图像分别与所述背景图像进行融合，获得多个目标图像；将所述多个目标图像与所述重音音频进行音视频编码，获得目标视频。2.根据权利要求1所述的方法，其特征在于，获取与所述原始图像相匹配的原始音频，包括：根据用户的选择操作获取与所述原始图像相匹配的原始音频；或者，识别所述原始图像的类型信息；基于所述类型信息获取与所述原始图像相匹配的原始音频。3.根据权利要求1所述的方法，其特征在于，对所述原始图像进行目标对象的分割，获得目标对象图像和背景图像，包括：对所述原始图像进行人像识别；若识别到人像，则将识别到的人像确定为目标对象；若未识别到人像，则对所述原始图像进行主体物体的识别，将识别到的主体物体确定为目标对象；将所述目标对象与背景进行分割，获得目标对象图像和背景图像。4.根据权利要求1所述的方法，其特征在于，对所述原始音频进行重音识别，获得重音音频，包括：对所述原始音频进行去噪处理；对去噪后的原始音频进行音符起始点检测，获得音符起始点；采用峰值检测算法对去噪后的原始音频的峰值进行检测，获得满足设定条件的峰值点；根据所述峰值点和所述音符起始点确定重音音频。5.根据权利要求1所述的方法，其特征在于，对所述目标对象图像的尺寸按照不同的调整比例进行调整，获得多个调整后的目标对象图像，包括：根据所述重音音频的时长确定所需的图像数量；根据所述图像数量确定调整比例的变化方式，获得多个不同的调整比例；其中，变化方式包括变化趋势以及变化步长；根据所述多个不同的调整比例分别对所述目标对象图像的尺寸进行调整，获得所述图像数量的调整后的目标对象图像。6.根据权利要求1所述的方法，其特征在于，所述重音音频包括重音起始点和重音终止点，将所述多个目标图像与所述重音音频进行编码，获得目标视频，包括：将所述多个目标图像中的首帧与所述重音起始点对齐，将所述多个目标图像中的尾帧与所述重音终止点对齐；2CN113905177A权利要求书2/2页基于对齐后的目标图像和重音音频进行音视频编码，获得目标视频。7.根据权利要求1所述的方法，其特征在于，在将所述多个目标图像与所述重音音频进行音视频编码之前，还包括：从所述多个目标图像中提取目标区域；其中，所述目标区域包含所述目标对象的部分或者全部像素点，且所述目标区域的中心点为所述目标对象的像素点；对所述目标区域执行如下至少一项处理：随机放大所述目标区域、随机缩小所述目标区域或者对所述目标区域进行镜像旋转。8.根据权利要求1所述的方法，其特征在于，对所述原始图像进行目标对象的分割，获得目标对象图像和背景图像，包括：将所述原始图像输入图像分割模型中，获得目标对象图像和背景图像；其中，所述图像分割模型包括：通道交换网络、通道切分网络及深度可分卷积网络；其中，所述深度可分卷积网络包括第一通道卷积子网络、深度卷积子网络、第二通道

相关资料

视频广告生成方法、装置、设备及存储介质.pdf

本发明提供一种视频广告生成方法、装置、设备及存储介质，通过接收请求端发送的视频生成请求，所述视频生成请求中包括经审核后的视频素材以及视频模板信息；根据视频素材以及视频模板信息生成视频广告。本发明将视频审核过程前置，在生成视频前审核视频素材内容，减小审核工作量，同时由于视频广告是根据视频素材以及视频模板信息生成，可控制视频样式、码率、分辨率等参数，可满足视频广告投放标准，视频广告生成完成后不需要再次审核，避免了用户自行生成的视频广告视频样式、码率、分辨率的参数不满足视频广告投放标准时带来的麻烦，为用户提供便

2023-06-14

507KB

视频生成方法、装置、设备及存储介质.pdf

本公开实施例公开了一种视频生成方法、装置、设备及存储介质。提取原始图像的第一特征信息和原始驱动视频中各视频帧的第二特征信息；其中，所述原始图像和所述原始驱动视频均包含人物形象；根据所述第一特征信息和各所述第二特征信息获取多个光流变换信息；根据所述第一特征信息和所述多个光流变换信息对所述原始图像进行变换处理，获得多个目标图像；将所述多个目标图像进行拼接，获得目标视频。本公开实施例提供的视频生成方法，基于第一特征信息和原始驱动视频对应的多个光流变换信息对原始图像进行变换处理，实现了将原始驱动视频中的人物表情转

2023-07-24

549KB

视频生成方法、装置、设备及存储介质.pdf

本公开实施例公开了一种视频生成方法、装置、设备及存储介质。获取原始图像及与原始图像相匹配的原始音频；对原始图像进行目标对象的分割，获得目标对象图像和背景图像；对原始音频进行重音识别，获得重音音频；对目标对象图像的尺寸按照不同的调整比例进行调整，获得多个调整后的目标对象图像；将多个调整后的目标对象图像分别与背景图像进行融合，获得多个目标图像；将多个目标图像与重音音频进行音视频编码，获得目标视频。本公开实施例提供的视频生成方法，将调整尺寸后的目标对象图像与重音音频进行音视频编码，获得目标视频，不仅可以提高视频

2023-07-24

791KB

视频资源生成方法、装置、设备及存储介质.pdf

本发明公开了一种视频资源生成方法、装置、设备及存储介质，该方法包括：在接收到视频资源生成请求时，从请求中提取请求图片数据以及视频生成参数；然后对请求图片数据以及视频生成参数进行序列化处理获得视频序列值；再判断历史序列值集合中是否存在视频序列值；若不存在则根据请求图片数据以及视频生成参数生成目标视频资源。本发明在接收到视频资源生成请求时并未直接进行视频资源的生成，而是先对请求图片数据以及视频生成参数进行序列化处理获得视频序列值，然后判断历史序列值集合中是否存在该视频序列值，不存在时再为用户生成视频资源，能够

2023-07-25

932KB

视频生成方法、装置、设备及存储介质.pdf

本发明提供一种视频生成方法、装置、设备及存储介质，该方法包括：获取目标人脸3D模型；根据所述目标人脸3D模型和待变换表情对应的预设人脸3D模型，获得中间人脸3D模型，所述待变换表情为多个表情中的任一个；提取所述中间人脸3D模型中的关键点坐标；所述关键点坐标包括：人脸五官轮廓的部分坐标；将所述目标人脸3D模型的关键点坐标根据预设渐变步长，逐步调整为中间人脸3D模型的关键点坐标，并采集每次调整后获得的2D图像，共获得N张2D图像，所述N为大于1的整数；根据所述N张2D图像，生成一段视频。本发明可以实现基于较少

2023-08-30

571KB