一种语音处理方法、装置和用于语音处理的装置-豆柴文库

一种语音处理方法、装置和用于语音处理的装置.pdf

2023-06-27

10金币

661KB

23页

努力****元恺

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共23页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113077808A(43)申请公布日2021.07.06(21)申请号202110303349.2(22)申请日2021.03.22(71)申请人北京搜狗科技发展有限公司地址100084北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间(72)发明人崔国辉(74)专利代理机构北京润泽恒知识产权代理有限公司11319代理人苏培华(51)Int.Cl.G10L21/0216(2013.01)G10L21/0208(2013.01)G10L15/20(2006.01)权利要求书2页说明书16页附图4页(54)发明名称一种语音处理方法、装置和用于语音处理的装置(57)摘要本发明实施例提供了一种语音处理方法、装置和用于语音处理的装置,应用于终端设备，所述终端设备设置有至少两个麦克风。其中的方法包括：将所述至少两个麦克风接收到的信号进行求和处理，得到第一路信号，以及将所述至少两个麦克风接收到的信号进行求差处理，得到第二路信号；将所述第一路信号和所述第二路信号进行盲分离处理，得到语音信号和噪音信号；基于所述噪音信号，将所述语音信号进行自适应噪音消除处理，得到目标语音信号。本发明实施例可以优化语音去噪效果，进而在环境复杂多变、噪音或者干扰较大的情况下，提高终端设备的语音识别准确率。CN113077808ACN113077808A权利要求书1/2页1.一种语音处理方法，其特征在于，应用于终端设备，所述终端设备设置有至少两个麦克风，所述方法包括：将所述至少两个麦克风接收到的信号进行求和处理，得到第一路信号，以及将所述至少两个麦克风接收到的信号进行求差处理，得到第二路信号；将所述第一路信号和所述第二路信号进行盲分离处理，得到语音信号和噪音信号；基于所述噪音信号，将所述语音信号进行自适应噪音消除处理，得到目标语音信号。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：将所述至少两个麦克风接收到的信号进行相位对齐；所述将所述至少两个麦克风接收到的信号进行求和处理，得到第一路信号，以及将所述至少两个麦克风接收到的信号进行求差处理，得到第二路信号，包括：将相位对齐后的所述至少两个麦克风接收到的信号进行求和处理，得到第一路信号，以及将相位对齐后的所述至少两个麦克风接收到的信号进行求差处理，得到第二路信号。3.根据权利要求1所述的方法，其特征在于，所述终端设备设置有两个麦克风，所述将所述至少两个麦克风接收到的信号进行求差处理，得到第二路信号，包括：在所述两个麦克风中确定第一麦克风和第二麦克风；将所述第二麦克风接收到的每帧信号减去所述第一麦克风接收到的每帧信号，得到第二路信号。4.根据权利要求1所述的方法，其特征在于，所述终端设备设置有n个麦克风，n大于2，所述将所述至少两个麦克风接收到的信号进行求差处理，得到第二路信号，包括：将第i个麦克风接收到的当前帧信号减去第i‑1个麦克风接收到的当前帧信号，得到n‑1路帧信号，i的取值为1至n；将所述n‑1路帧信号分别与参考信号y(n)进行自适应滤波处理，得到处理后的n‑1路帧信号，其中，y(n)＝yc(n)‑N(n)，yc(n)为所述n个麦克风接收到的上一帧信号的和，N(n)为上一帧输出的第二路帧信号；将所述处理后的n‑1路帧信号求和，得到当前帧输出的第二路帧信号；在所述n个麦克风接收到的所有帧信号处理完成之后，得到第二路信号。5.根据权利要求1所述的方法，其特征在于，所述将所述第一路信号和所述第二路信号进行盲分离处理，得到语音信号和噪音信号，包括：将所述第一路信号中的每帧信号采用独立向量分析盲分离算法进行盲分离处理，得到语音信号，以及将所述第二路信号中的每帧信号采用独立向量分析盲分离算法进行盲分离处理，得到噪音信号。6.根据权利要求1所述的方法，其特征在于，所述将所述第一信号和所述第二信号进行盲分离处理，得到语音信号和噪音信号之后，所述方法还包括：将所述语音信号中的每帧信号进行话音激活检测；将话音激活检测结果为话音信号的帧信号设置话音信号标志位；所述将所述语音信号进行自适应噪音消除处理，包括：将所述语音信号中具有话音信号标志位的帧信号进行自适应噪音消除处理。7.根据权利要求1所述的方法，其特征在于，所述基于所述噪音信号，将所述语音信号进行自适应噪音消除处理，得到目标语音信号，包括：2CN113077808A权利要求书2/2页将所述噪音信号作为参考信号，以及将所述语音信号作为目标信号，基于递归最小二乘法RLS的自适应滤波算法对所述语音信号进行自适应噪音消除处理，得到目标语音信号。8.一种语音处理装置，其特征在于，应用于终端设备，所述终端设备设置有至少两个麦克风，所述装置包括：粗分离模块，用于将所述至少两个麦克风接收到的信号进

相关资料

一种语音处理方法、装置和用于语音处理的装置.pdf

本发明实施例提供了一种语音处理方法、装置和用于语音处理的装置,应用于终端设备，所述终端设备设置有至少两个麦克风。其中的方法包括：将所述至少两个麦克风接收到的信号进行求和处理，得到第一路信号，以及将所述至少两个麦克风接收到的信号进行求差处理，得到第二路信号；将所述第一路信号和所述第二路信号进行盲分离处理，得到语音信号和噪音信号；基于所述噪音信号，将所述语音信号进行自适应噪音消除处理，得到目标语音信号。本发明实施例可以优化语音去噪效果，进而在环境复杂多变、噪音或者干扰较大的情况下，提高终端设备的语音识别准确率

2023-06-27

661KB

语音处理方法、装置以及用于语音处理的装置.pdf

本发明提供了一种语音处理方法及装置，在对语音文件进行录制或播放的情况下，响应于对电子设备中目标区域的敲击操作，在语音文件的时间轴中确定目标时刻；对时间轴中的目标时刻进行标记；在语音文件中，将与目标时刻相邻的至少一个语音片段转换为目标文本，并对目标文本进行智能整理，本发明可以对电子设备的目标位置进行敲击操作来快速便捷的完成标记；提高了标记效率，降低了标记繁琐程度。另外，作为重要内容的目标文本，在用户进行目标时刻标记的同时就会自动生成，并不需要用户重复将语音文件在目标时刻进行播放，也不需要用户人工记录生成重要

2023-07-24

688KB

语音处理装置、语音处理方法和程序.pdf

本发明提供了一种语音处理装置、语音处理方法和程序，所述语音处理装置包括：数据获取单元，用于获取定义音乐进行中一个或更多个时间点或者一个或更多个时间段的特性的音乐进行数据；确定单元，用于通过采用数据获取单元获取的音乐进行数据确定要在播放音乐期间输出语音的输出时间点；以及音频输出单元，用于在播放音乐期间在确定单元确定的输出时间点输出语音。

2024-01-04

1.1MB

用于训练语音处理模型的方法和装置.pdf

本公开的实施例公开了用于训练语音处理模型的方法和装置。该方法的一具体实施方式包括：获取初始第一语音处理模型和端到端的初始第二语音处理模型，其中，初始第一语音处理模型和初始第二语音处理模型包括相同的特征提取网络，初始第二语音处理模型还包括分类网络，特征提取网络用于提取语音的特征向量，分类网络用于根据语音的特征向量确认说话人是否为目标人；利用交替训练的方法训练初始第一语音处理模型和初始第二语音处理模型，以及将训练完成的初始第二语音处理模型确定为待用语音处理模型。该实施方式可以获得端到端的语音处理模型。

2023-06-14

702KB

语音处理方法和装置.pdf

本申请公开了语音处理方法和装置，涉及人工智能技术领域，进一步涉及语音处理技术领域。具体实施方式包括：将目标语音分成多个第一片段；将多个第一片段分别输入训练后的神经网络，生成多个第一片段分别对应的特征向量，得到多个特征向量；由多个特征向量，确定出至少两个特征向量作为说话人向量；对于多个说话人向量中的说话人向量，获取该说话人向量与各个特征向量的相关度，并根据相关度对多个第一片段进行迭代聚类，生成不同类别的第一片段之间的分割点；根据分割点，将目标语音或多个第一片段分成至少两个第二片段，其中，每个第二片段对应一个

2023-06-14

704KB