用于语音处理的方法和设备-豆柴文库

用于语音处理的方法和设备.pdf

2023-07-25

10金币

1KB

26页

努力****梓颖

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共26页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113643698A(43)申请公布日2021.11.12(21)申请号202110096040.0G10L25/45(2013.01)(22)申请日2021.01.25G10L19/00(2013.01)(30)优先权数据10-2020-00512692020.04.28KR(71)申请人三星电子株式会社地址韩国京畿道水原市(72)发明人姜泰均(74)专利代理机构北京铭硕知识产权代理有限公司11286代理人张川绪刘灿强(51)Int.Cl.G10L15/22(2006.01)G10L15/04(2013.01)G10L15/12(2006.01)G10L25/30(2013.01)权利要求书3页说明书12页附图10页(54)发明名称用于语音处理的方法和设备(57)摘要公开了一种用于语音处理的方法和设备。所述方法包括：从语音信号确定目标段；通过对目标段进行解码来确定与目标段对应的目标字符序列；基于编辑距离来确认目标字符序列与先前字符序列之间的第一重叠部分；以及基于第一重叠部分对目标字符序列和先前字符序列进行合并。基于在编辑距离执行的操作的类型、将被操作的字符是否位于第一重叠部分中和将被操作的字符是否匹配中的任何一个或者任何两个或更多个的任何组合来确定编辑距离的成本。CN113643698ACN113643698A权利要求书1/3页1.一种用于语音处理的方法，所述方法包括：从语音信号确定目标段；通过对目标段进行解码来确定与目标段对应的目标字符序列；基于编辑距离来确认目标字符序列与先前字符序列之间的第一重叠部分；以及基于第一重叠部分对目标字符序列和先前字符序列进行合并，其中，编辑距离表示目标字符序列与先前字符序列之间的差异程度，所述差异程度通过量化将单个字符序列转换为另一字符序列所需的最小操作成本来获得。2.根据权利要求1所述的方法，其中，基于编辑距离的成本来来确认目标字符序列与先前字符序列之间的第一重叠部分，其中，基于对目标字符序列和先前字符序列执行的操作的类型、目标字符序列与先前字符序列是否位于第一重叠部分中和目标字符序列与先前字符序列在第一重叠部分中是否匹配中的任何一个或者任何两个或更多个的任何组合来确定编辑距离的成本。3.根据权利要求1所述的方法，其中，基于第一重叠部分对目标字符序列和先前字符序列进行合并的步骤包括：确认第一重叠部分中的词边界，将确认的词边界指定为转换候选，从指定的转换候选选择位于最靠近第一重叠部分的中心的一个转换候选作为转换点，通过将先前字符序列中的转换点之前的所有词连接到目标字符序列中的转换点之后的所有词，来对先前字符序列和目标字符序列进行合并。4.根据权利要求2所述的方法，其中，编辑距离的成本被不同地应用于目标字符序列与先前字符序列之间的第一重叠部分和非重叠部分。5.根据权利要求2所述的方法，其中，在目标字符序列与先前字符序列之间的非重叠部分中发生的编辑距离的插入成本小于在第一重叠部分中发生的编辑距离的插入成本。6.根据权利要求2所述的方法，其中，编辑距离的匹配成本小于在目标字符序列与先前字符序列之间的非重叠部分中发生的编辑距离的插入成本。7.根据权利要求2所述的方法，其中，在第一重叠部分中发生的编辑距离的插入成本、删除成本和替换成本是正数。8.根据权利要求2所述的方法，其中，编辑距离的匹配成本是负数，并且在目标字符序列与先前字符序列之间的非重叠部分中发生的编辑距离的插入成本为零。9.根据权利要求1所述的方法，其中，从语音信号确定目标段的步骤包括：基于段长度和段之间的重叠长度从语音信号确定目标段。10.根据权利要求9所述的方法，其中，基于执行所述方法的设备的可用资源来确定段之间的重叠长度。11.根据权利要求1所述的方法，其中，确认的步骤包括：根据用户在段之间的重叠长度期间说出的最大字符长度，来确认目标字符序列与从先前字符序列提取的部分序列之间的第二重叠部分。12.根据权利要求1至11中的任意一项所述的方法，其中，基于对与语音信号中的目标段部分重叠的先前段进行解码的结果来确定先前字符序列。2CN113643698A权利要求书2/3页13.根据权利要求12所述的方法，其中，确认的步骤包括：确认目标字符序列与先前字符序列中的对先前段进行解码获得的字符序列之间的第三重叠部分。14.根据权利要求12所述的方法，其中，目标段中的第一重叠部分小于目标段的一半。15.一种用于语音处理的设备，所述设备包括：一个或多个处理器，被配置为：从语音信号确定目标段，通过对目标段进行解码来确定与目标段对应的目标字符序列，基于编辑距离来确认目标字符序列与先前字符序列之间的重叠部分，以及基于重叠部分对目标字符序列和先前字符序列进行合并，其中，编辑距离表示目标

相关资料

用于语音处理的方法和设备.pdf

公开了一种用于语音处理的方法和设备。所述方法包括：从语音信号确定目标段；通过对目标段进行解码来确定与目标段对应的目标字符序列；基于编辑距离来确认目标字符序列与先前字符序列之间的第一重叠部分；以及基于第一重叠部分对目标字符序列和先前字符序列进行合并。基于在编辑距离执行的操作的类型、将被操作的字符是否位于第一重叠部分中和将被操作的字符是否匹配中的任何一个或者任何两个或更多个的任何组合来确定编辑距离的成本。

2023-07-25

1KB

用于在移动终端中处理语音通信的设备和方法.pdf

提供一种用于在移动终端中处理语音通信的设备和方法。所述设备和方法处理语音通信服务。本公开的移动终端装置包括：麦克风，布置在装置的主体的一端；扬声器，布置在靠近麦克风处；收发器，布置在主体的另一端；编解码器，包括连接到麦克风的编码器、连接到扬声器的解码器以及开关，所述开关的一个节点选择性地连接到编码器和解码器之一，所述开关的另一节点连接到收发器；通信控制器，控制所述开关在扬声器模式下建立编码器和收发器之间的路径并启用扬声器。

2023-06-07

467KB

一种语音处理方法、装置和用于语音处理的装置.pdf

本发明实施例提供了一种语音处理方法、装置和用于语音处理的装置,应用于终端设备，所述终端设备设置有至少两个麦克风。其中的方法包括：将所述至少两个麦克风接收到的信号进行求和处理，得到第一路信号，以及将所述至少两个麦克风接收到的信号进行求差处理，得到第二路信号；将所述第一路信号和所述第二路信号进行盲分离处理，得到语音信号和噪音信号；基于所述噪音信号，将所述语音信号进行自适应噪音消除处理，得到目标语音信号。本发明实施例可以优化语音去噪效果，进而在环境复杂多变、噪音或者干扰较大的情况下，提高终端设备的语音识别准确率

2023-06-27

661KB

用于训练语音处理模型的方法和装置.pdf

本公开的实施例公开了用于训练语音处理模型的方法和装置。该方法的一具体实施方式包括：获取初始第一语音处理模型和端到端的初始第二语音处理模型，其中，初始第一语音处理模型和初始第二语音处理模型包括相同的特征提取网络，初始第二语音处理模型还包括分类网络，特征提取网络用于提取语音的特征向量，分类网络用于根据语音的特征向量确认说话人是否为目标人；利用交替训练的方法训练初始第一语音处理模型和初始第二语音处理模型，以及将训练完成的初始第二语音处理模型确定为待用语音处理模型。该实施方式可以获得端到端的语音处理模型。

2023-06-14

702KB

语音处理方法、装置以及用于语音处理的装置.pdf

本发明提供了一种语音处理方法及装置，在对语音文件进行录制或播放的情况下，响应于对电子设备中目标区域的敲击操作，在语音文件的时间轴中确定目标时刻；对时间轴中的目标时刻进行标记；在语音文件中，将与目标时刻相邻的至少一个语音片段转换为目标文本，并对目标文本进行智能整理，本发明可以对电子设备的目标位置进行敲击操作来快速便捷的完成标记；提高了标记效率，降低了标记繁琐程度。另外，作为重要内容的目标文本，在用户进行目标时刻标记的同时就会自动生成，并不需要用户重复将语音文件在目标时刻进行播放，也不需要用户人工记录生成重要

2023-07-24

688KB