一种语音处理方法、装置和用于语音处理的装置.pdf
努力****元恺
亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种语音处理方法、装置和用于语音处理的装置.pdf
本发明实施例提供了一种语音处理方法、装置和用于语音处理的装置,应用于终端设备,所述终端设备设置有至少两个麦克风。其中的方法包括:将所述至少两个麦克风接收到的信号进行求和处理,得到第一路信号,以及将所述至少两个麦克风接收到的信号进行求差处理,得到第二路信号;将所述第一路信号和所述第二路信号进行盲分离处理,得到语音信号和噪音信号;基于所述噪音信号,将所述语音信号进行自适应噪音消除处理,得到目标语音信号。本发明实施例可以优化语音去噪效果,进而在环境复杂多变、噪音或者干扰较大的情况下,提高终端设备的语音识别准确率
语音处理方法、装置以及用于语音处理的装置.pdf
本发明提供了一种语音处理方法及装置,在对语音文件进行录制或播放的情况下,响应于对电子设备中目标区域的敲击操作,在语音文件的时间轴中确定目标时刻;对时间轴中的目标时刻进行标记;在语音文件中,将与目标时刻相邻的至少一个语音片段转换为目标文本,并对目标文本进行智能整理,本发明可以对电子设备的目标位置进行敲击操作来快速便捷的完成标记;提高了标记效率,降低了标记繁琐程度。另外,作为重要内容的目标文本,在用户进行目标时刻标记的同时就会自动生成,并不需要用户重复将语音文件在目标时刻进行播放,也不需要用户人工记录生成重要
语音处理装置、语音处理方法和程序.pdf
本发明提供了一种语音处理装置、语音处理方法和程序,所述语音处理装置包括:数据获取单元,用于获取定义音乐进行中一个或更多个时间点或者一个或更多个时间段的特性的音乐进行数据;确定单元,用于通过采用数据获取单元获取的音乐进行数据确定要在播放音乐期间输出语音的输出时间点;以及音频输出单元,用于在播放音乐期间在确定单元确定的输出时间点输出语音。
用于训练语音处理模型的方法和装置.pdf
本公开的实施例公开了用于训练语音处理模型的方法和装置。该方法的一具体实施方式包括:获取初始第一语音处理模型和端到端的初始第二语音处理模型,其中,初始第一语音处理模型和初始第二语音处理模型包括相同的特征提取网络,初始第二语音处理模型还包括分类网络,特征提取网络用于提取语音的特征向量,分类网络用于根据语音的特征向量确认说话人是否为目标人;利用交替训练的方法训练初始第一语音处理模型和初始第二语音处理模型,以及将训练完成的初始第二语音处理模型确定为待用语音处理模型。该实施方式可以获得端到端的语音处理模型。
语音处理方法和装置.pdf
本申请公开了语音处理方法和装置,涉及人工智能技术领域,进一步涉及语音处理技术领域。具体实施方式包括:将目标语音分成多个第一片段;将多个第一片段分别输入训练后的神经网络,生成多个第一片段分别对应的特征向量,得到多个特征向量;由多个特征向量,确定出至少两个特征向量作为说话人向量;对于多个说话人向量中的说话人向量,获取该说话人向量与各个特征向量的相关度,并根据相关度对多个第一片段进行迭代聚类,生成不同类别的第一片段之间的分割点;根据分割点,将目标语音或多个第一片段分成至少两个第二片段,其中,每个第二片段对应一个