预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115002395A(43)申请公布日2022.09.02(21)申请号202210592143.0G06V10/40(2022.01)(22)申请日2022.05.27(71)申请人中国工商银行股份有限公司地址100140北京市西城区复兴门内大街55号(72)发明人徐雪袁广亮罗亚明杨洁琼(74)专利代理机构中科专利商标代理有限责任公司11021专利代理师吴梦圆(51)Int.Cl.H04N7/15(2006.01)G10L25/27(2013.01)G10L25/57(2013.01)G10L25/03(2013.01)G06V20/40(2022.01)权利要求书2页说明书12页附图5页(54)发明名称数据处理方法、装置、电子设备和存储介质(57)摘要本公开提供了一种数据处理方法、装置、电子设备和存储介质,可以应用于计算机技术领域和音视频处理技术领域。该方法包括:获取待处理会话数据,其中,待处理会话数据包括会话类型数据、音频数据和/或视频数据;对待处理会话数据进行预处理得到会话特征数据,其中,会话特征数据包括音频数据的时域特征、音频数据的频域特征和/或视频数据的图像运动特征;将会话特征数据输入质量提升模型的全连接层,输出目标时域特征、目标频域特征和/或目标图像运动特征;将目标时域特征、目标频域特征和/或目标图像运动特征输入质量提升模型的重建层,输出目标会话数据;按照目标格式向终端发送目标会话数据,其中,目标格式是根据会话类型数据确定的。CN115002395ACN115002395A权利要求书1/2页1.一种数据处理方法,包括:获取待处理会话数据,其中,所述待处理会话数据包括会话类型数据、音频数据和/或视频数据;对所述待处理会话数据进行预处理得到会话特征数据,其中,所述会话特征数据包括所述音频数据的时域特征、所述音频数据的频域特征和/或所述视频数据的图像运动特征;将所述会话特征数据输入质量提升模型的全连接层,输出目标时域特征、目标频域特征和/或目标图像运动特征;将所述目标时域特征、所述目标频域特征和/或所述目标图像运动特征输入所述质量提升模型的重建层,输出目标会话数据;按照目标格式向终端发送所述目标会话数据,其中,所述目标格式是根据所述会话类型数据确定的。2.根据权利要求1所述的方法,其中,所述对所述待处理会话数据进行预处理得到会话特征数据,包括:去除所述待处理会话数据中的异常频谱数据,得到目标频谱数据;根据所述会话类型数据,构建所述会话特征矩阵;根据所述目标频谱数据和所述会话特征矩阵,生成所述会话特征数据。3.根据权利要求1所述的方法,其中,所述将所述会话特征数据输入质量提升模型的全连接层,输出目标时域特征、目标频域特征和/或目标图像运动特征,包括:将所述会话特征数据输入质量提升模型的全连接层,通过所述全连接层中的注意力模块优化所述会话特征数据,得到所述目标时域特征、所述目标频域特征和/或所述目标图像运动特征;输出所述目标时域特征、所述目标频域特征和/或所述目标图像运动特征。4.根据权利要求1至3中任一项所述的方法,其中,所述按照目标格式向终端发送所述目标会话数据,包括:识别所述目标会话数据的会话格式;在所述会话格式与所述目标格式不一致的情况下,将所述会话格式转换为所述目标格式后发送所述目标会话数据。5.根据权利要求4所述的方法,其中,所述识别所述目标会话数据的会话格式,包括:获取所述目标会话数据的目标会话类型数据;根据所述目标会话类型数据确定所述会话格式。6.根据权利要求1至3中任一项所述的方法,所述质量提升模型的训练方法包括:获取训练样本,其中,所述训练样本包括第一数据样本和第二数据样本,第一数据样本表征待处理会话数据,第二数据样本表征经过会话系统传输的待处理会话数据;将所述第一数据样本作为标签,第二数据样本作为输出对未训练质量提升模型进行训练,得到所述质量提升模型。7.一种数据处理装置,包括:获取模块,用于获取待处理会话数据,其中,所述待处理会话数据包括会话类型数据、音频数据和/或视频数据;预处理模块,用于对所述待处理会话数据进行预处理得到会话特征数据,其中,所述会2CN115002395A权利要求书2/2页话特征数据包括所述音频数据的时域特征、所述音频数据的频域特征和/或所述视频数据的图像运动特征;第一输出模块,用于将所述会话特征数据输入质量提升模型的全连接层,输出目标时域特征、目标频域特征和/或目标图像运动特征;第二输出模块,用于将所述目标时域特征、所述目标频域特征和/或所述目标图像运动特征输入所述质量提升模型的重建层,发送目标会话数据;发送模块,用于按照目标格式向终端发送所述目标会话数据,其中,所述目标格式是根据所述会话类型数据确定的。8.一种电