多模态特征融合方法、装置、电子设备及可读存储介质.pdf
涵蓄****09
亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
多模态特征融合方法、装置、电子设备及可读存储介质.pdf
本申请提供了一种多模态特征融合方法、装置、电子设备及可读存储介质,获取目标对象的多个异源异构数据;针对于每个异源异构数据,提取该异源异构数据的单模态特征矩阵;针对每个单模态特征矩阵,基于该单模态特征矩阵与其所对应的多个单模态权重矩阵,确定该单模态特征矩阵的融合特征矩阵;针对每个融合特征矩阵,确定该融合特征矩阵与各个融合特征矩阵之间的融合权重矩阵;对每个融合权重矩阵进行归一化处理,得到归一化后的融合权重矩阵;基于每个融合特征矩阵和每个融合特征矩阵所对应的多个归一化后的融合权重矩阵,确定描述目标对象的多模态特
多模态翻译方法、装置、电子设备及计算机可读存储介质.pdf
本申请实施例提供了一种多模态翻译方法、装置、电子设备及计算机可读存储介质,属于自然语言处理领域,该方法包括:获取源语言的多模态输入;根据所述多模态输入确定场景信息;基于所述场景信息,采用翻译模型获取目标语言的翻译内容。本申请的多模态翻译方法可以帮助翻译模型更好的判断当前的场景,从而减少语义理解的歧义现象,提高翻译的准确性。
视频融合方法、装置、电子设备及可读存储介质.pdf
本申请公开了一种视频融合方法、装置、电子设备及可读存储介质,涉及计算机视觉技术。具体实现方案为根据用户视频的各视频帧图像和模板视频的各视频帧图像,获得用户视频的各视频帧图像中人脸图像的预测三维人脸网格;根据用户视频的各视频帧图像中人脸图像的用户三维人脸网格的用户纹理和模板视频的各视频帧图像中人脸图像的模板三维人脸网格的模板纹理,获得预测三维人脸网格的预测纹理;根据预测三维人脸网格、预测纹理和用户人脸姿态,以及模板人脸姿态,获得预测三维人脸网格的渲染人脸图像;对渲染人脸图像和模板视频的各视频帧图像进行融合处
图像融合方法、装置、电子设备及可读存储介质.pdf
本申请提供一种图像融合方法、装置、电子设备及可读存储介质,涉及图像处理技术领域。该方法包括:获取待融合的M张图像中各个目标像素值组合,每个所述目标像素值组合包括相互对应的M个像素点的像素值;获取预先通过神经网络模型确定的权重字典,所述权重字典包含对应不同像素值组合的融合权重;根据所述权重字典确定各个所述目标像素值组合对应的融合权重;基于各个所述目标像素值组合对应的融合权重将所述M张图像进行融合,获得融合的目标图像。本方案相比于人工通过经验设置权重的方式,通过上述方式获得的权重更加合理,具有较强的鲁棒性,从
图像融合的方法、装置、电子设备及可读存储介质.pdf
本申请实施例提供了一种图像融合的方法、装置、电子设备及可读存储介质。该方法包括:获取同一场景下的至少两张待处理RAW图像;将至少两张待处理RAW图像中的一张图像作为参考帧,其它图像作为补充帧,并分别确定每个补充帧与参考帧之间的亮度关系;针对每个补充帧,基于亮度关系,对补充帧中像素的亮度进行线性调整,得到调整后的补充帧;对调整后的各补充帧以及参考帧进行融合,得到融合图像。本申请实施例,由于调整后的各补充帧是基于参考帧的亮度调整的,因此调整后的各补充帧的亮度与参考帧的亮度之间的差异可以进一步减小,进而可以有效