用于语音设备的人声识别与增强方法、装置及存储介质.pdf
萌运****魔王
亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
用于语音设备的人声识别与增强方法、装置及存储介质.pdf
本发明实施例公开了一种用于语音设备的人声识别与增强方法、装置及存储介质,涉及通信技术领域,能够应用于应急救援中需要在面罩内对对讲机的声音进行扩音和声音增强的场景。本发明包括:通过NLMS算法对采集的声音信号进行回声消除,其中,在所采集的声音信号中包括了环境噪音和语音信号;对经过步骤1处理的声音进行频谱分析,并提取符合人声特征的声音信号;通过IIR对符合人声特征的声音信号进行增强处理;将经过增强处理的声音信号送给对讲模块。
语音增强方法、装置、设备及存储介质.pdf
本发明公开了一种语音增强方法、装置、设备及存储介质。获取语音样本数据,并将所述语音样本数据按照设定比例拆分为训练集和验证集;其中,所述语音样本数据包括带噪语音及对应的纯净语音;基于所述训练集对设定语音增强模型进行训练;基于所述验证集对训练后的所述设定语音增强模型进行验证;将待增强语音输入验证后的所述设定语音增强模型,输出目标语音。本发明实施例提供的语音增强方法,将待增强语音输入验证后的设定语音增强模型,输出目标语音,可以改善语音增强过程中容易产生语音丢失和语音失真等损伤原始语音数据的问题,保证语音增强的效
用于目标设备的语音识别方法、装置、设备及存储介质.pdf
本发明提供一种用于目标设备的语音识别方法、装置、设备及存储介质,所述方法包括:获取音频信号,得到所述音频信号的声学特征,将所述声学特征输入第一声学模型,得到音素级特征与该音素级特征相关联的音素级概率向量;若所述目标设备的当前工作模式为唤醒模式,则将音素级概率向量输入预设的解码器以识别唤醒词,并在识别出唤醒词的情况下将目标设备的工作模式转换为命令词模式;若目标设备的当前工作模式为命令词模式,则将音素级特征输入第二声学模型,以在识别出命令词时触发所述目标设备执行所述命令词对应的动作。本发明可解决目前不同长度的
语音识别方法、装置、设备及存储介质.pdf
本发明公开了一种语音识别方法、装置、设备及存储介质。该方法包括:将目标用户语音数据输入设定声学模型中,输出所述目标用户语音数据对应的声学特征序列;其中,所述目标用户语音数据携带有地域属性;所述声学特征序列包括多个声学特征;确定所述声学特征序列中各声学特征对应的至少一个目标词,获得多个目标词;将所述多个目标词输入领域语言模型中,输出目标语音识别结果;其中,所述目标语音识别结果由词序列表征。通过本发明的技术方案,可以提高语音识别的准确性。
语音增强方法、装置、设备、存储介质及程序产品.pdf
本申请公开了一种语音增强方法、装置、设备、存储介质及程序产品,涉及语音技术处理领域。该方法包括:沿频域维度对待进行语音增强的目标音频进行频带切分,得到至少两个子频带;获取至少两个子频带分别对应的子带能量数据;沿时域维度对至少两个子频带分别对应的子带能量数据进行分析,得到至少两个子频带分别对应的子带能量分布数据;当指定子频带对应的子带能量分布数据符合调整条件的情况下,对指定子频带的子带能量数据进行调整,得到目标增强音频。通过以上方式,能够有选择地对目标音频中不符合调整条件的子带能量数据进行调整,在充分考虑目