预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共26页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113643698A(43)申请公布日2021.11.12(21)申请号202110096040.0G10L25/45(2013.01)(22)申请日2021.01.25G10L19/00(2013.01)(30)优先权数据10-2020-00512692020.04.28KR(71)申请人三星电子株式会社地址韩国京畿道水原市(72)发明人姜泰均(74)专利代理机构北京铭硕知识产权代理有限公司11286代理人张川绪刘灿强(51)Int.Cl.G10L15/22(2006.01)G10L15/04(2013.01)G10L15/12(2006.01)G10L25/30(2013.01)权利要求书3页说明书12页附图10页(54)发明名称用于语音处理的方法和设备(57)摘要公开了一种用于语音处理的方法和设备。所述方法包括:从语音信号确定目标段;通过对目标段进行解码来确定与目标段对应的目标字符序列;基于编辑距离来确认目标字符序列与先前字符序列之间的第一重叠部分;以及基于第一重叠部分对目标字符序列和先前字符序列进行合并。基于在编辑距离执行的操作的类型、将被操作的字符是否位于第一重叠部分中和将被操作的字符是否匹配中的任何一个或者任何两个或更多个的任何组合来确定编辑距离的成本。CN113643698ACN113643698A权利要求书1/3页1.一种用于语音处理的方法,所述方法包括:从语音信号确定目标段;通过对目标段进行解码来确定与目标段对应的目标字符序列;基于编辑距离来确认目标字符序列与先前字符序列之间的第一重叠部分;以及基于第一重叠部分对目标字符序列和先前字符序列进行合并,其中,编辑距离表示目标字符序列与先前字符序列之间的差异程度,所述差异程度通过量化将单个字符序列转换为另一字符序列所需的最小操作成本来获得。2.根据权利要求1所述的方法,其中,基于编辑距离的成本来来确认目标字符序列与先前字符序列之间的第一重叠部分,其中,基于对目标字符序列和先前字符序列执行的操作的类型、目标字符序列与先前字符序列是否位于第一重叠部分中和目标字符序列与先前字符序列在第一重叠部分中是否匹配中的任何一个或者任何两个或更多个的任何组合来确定编辑距离的成本。3.根据权利要求1所述的方法,其中,基于第一重叠部分对目标字符序列和先前字符序列进行合并的步骤包括:确认第一重叠部分中的词边界,将确认的词边界指定为转换候选,从指定的转换候选选择位于最靠近第一重叠部分的中心的一个转换候选作为转换点,通过将先前字符序列中的转换点之前的所有词连接到目标字符序列中的转换点之后的所有词,来对先前字符序列和目标字符序列进行合并。4.根据权利要求2所述的方法,其中,编辑距离的成本被不同地应用于目标字符序列与先前字符序列之间的第一重叠部分和非重叠部分。5.根据权利要求2所述的方法,其中,在目标字符序列与先前字符序列之间的非重叠部分中发生的编辑距离的插入成本小于在第一重叠部分中发生的编辑距离的插入成本。6.根据权利要求2所述的方法,其中,编辑距离的匹配成本小于在目标字符序列与先前字符序列之间的非重叠部分中发生的编辑距离的插入成本。7.根据权利要求2所述的方法,其中,在第一重叠部分中发生的编辑距离的插入成本、删除成本和替换成本是正数。8.根据权利要求2所述的方法,其中,编辑距离的匹配成本是负数,并且在目标字符序列与先前字符序列之间的非重叠部分中发生的编辑距离的插入成本为零。9.根据权利要求1所述的方法,其中,从语音信号确定目标段的步骤包括:基于段长度和段之间的重叠长度从语音信号确定目标段。10.根据权利要求9所述的方法,其中,基于执行所述方法的设备的可用资源来确定段之间的重叠长度。11.根据权利要求1所述的方法,其中,确认的步骤包括:根据用户在段之间的重叠长度期间说出的最大字符长度,来确认目标字符序列与从先前字符序列提取的部分序列之间的第二重叠部分。12.根据权利要求1至11中的任意一项所述的方法,其中,基于对与语音信号中的目标段部分重叠的先前段进行解码的结果来确定先前字符序列。2CN113643698A权利要求书2/3页13.根据权利要求12所述的方法,其中,确认的步骤包括:确认目标字符序列与先前字符序列中的对先前段进行解码获得的字符序列之间的第三重叠部分。14.根据权利要求12所述的方法,其中,目标段中的第一重叠部分小于目标段的一半。15.一种用于语音处理的设备,所述设备包括:一个或多个处理器,被配置为:从语音信号确定目标段,通过对目标段进行解码来确定与目标段对应的目标字符序列,基于编辑距离来确认目标字符序列与先前字符序列之间的重叠部分,以及基于重叠部分对目标字符序列和先前字符序列进行合并,其中,编辑距离表示目标