用于训练语音处理模型的方法和装置.pdf
觅松****哥哥
亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
用于训练语音处理模型的方法和装置.pdf
本公开的实施例公开了用于训练语音处理模型的方法和装置。该方法的一具体实施方式包括:获取初始第一语音处理模型和端到端的初始第二语音处理模型,其中,初始第一语音处理模型和初始第二语音处理模型包括相同的特征提取网络,初始第二语音处理模型还包括分类网络,特征提取网络用于提取语音的特征向量,分类网络用于根据语音的特征向量确认说话人是否为目标人;利用交替训练的方法训练初始第一语音处理模型和初始第二语音处理模型,以及将训练完成的初始第二语音处理模型确定为待用语音处理模型。该实施方式可以获得端到端的语音处理模型。
一种语音处理方法、装置和用于语音处理的装置.pdf
本发明实施例提供了一种语音处理方法、装置和用于语音处理的装置,应用于终端设备,所述终端设备设置有至少两个麦克风。其中的方法包括:将所述至少两个麦克风接收到的信号进行求和处理,得到第一路信号,以及将所述至少两个麦克风接收到的信号进行求差处理,得到第二路信号;将所述第一路信号和所述第二路信号进行盲分离处理,得到语音信号和噪音信号;基于所述噪音信号,将所述语音信号进行自适应噪音消除处理,得到目标语音信号。本发明实施例可以优化语音去噪效果,进而在环境复杂多变、噪音或者干扰较大的情况下,提高终端设备的语音识别准确率
语音处理方法、装置以及用于语音处理的装置.pdf
本发明提供了一种语音处理方法及装置,在对语音文件进行录制或播放的情况下,响应于对电子设备中目标区域的敲击操作,在语音文件的时间轴中确定目标时刻;对时间轴中的目标时刻进行标记;在语音文件中,将与目标时刻相邻的至少一个语音片段转换为目标文本,并对目标文本进行智能整理,本发明可以对电子设备的目标位置进行敲击操作来快速便捷的完成标记;提高了标记效率,降低了标记繁琐程度。另外,作为重要内容的目标文本,在用户进行目标时刻标记的同时就会自动生成,并不需要用户重复将语音文件在目标时刻进行播放,也不需要用户人工记录生成重要
语音降噪模型的训练方法和装置及语音降噪方法和装置.pdf
本公开关于语音降噪模型的训练方法和装置及语音降噪方法和装置。训练方法包括:获取含噪语音信号样本,含噪语音信号样本是通过将多条原始语音信号及噪声信号混合得到,每条原始语音信号具有距离值,该距离值表示原始语音信号与目标麦克风位置之间的距离;获取预设第一保留距离值以及目标降噪语音信号,目标降噪语音信号是通过基于每条原始语音信号的距离值以及预设第一保留距离值计算得到;将含噪语音信号样本的幅度谱和预设第一保留距离值输入语音降噪模型,得到估计的降噪语音信号的幅度谱;基于估计的降噪语音信号的幅度谱与目标降噪语音信号的幅
语音增强模型的训练方法和装置及语音增强方法和装置.pdf
本申请涉及语音处理技术领域,提供了一种语音增强模型的训练方法和装置及语音增强方法和装置。所述语音增强模型的训练方法包括:获取语音训练集;其中,语音训练集中包括含噪语音样本和纯净语音样本;获取含噪语音样本对应的幅度谱输入生成网络,获取增强语音幅度谱;获取纯净语音样本对应的幅度谱和增强语音幅度谱输入判别网络,获取判别结果;根据增强语音幅度谱、纯净语音样本对应的幅度谱、判别结果与优化目标调整生成网络和判别网络的网络参数,生成语音增强模型。采用本方法能够提高语音增强模型的性能,进而提升语音增强的效果。