预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共41页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113661719A(43)申请公布日2021.11.16(21)申请号202080027036.2(74)专利代理机构北京康信知识产权代理有限(22)申请日2020.02.10责任公司11240代理人吴孟秋(30)优先权数据2019-0735422019.04.08JP(51)Int.Cl.H04R1/10(2006.01)(85)PCT国际申请进入国家阶段日H04R3/00(2006.01)2021.09.30G10L21/0272(2006.01)(86)PCT国际申请的申请数据G10L15/20(2006.01)PCT/JP2020/0050612020.02.10G10L25/84(2006.01)(87)PCT国际申请的公布数据WO2020/208926JA2020.10.15(71)申请人索尼集团公司地址日本东京(72)发明人广江厚夫权利要求书2页说明书17页附图21页(54)发明名称信号处理装置、信号处理方法和程序(57)摘要一种信号处理装置,具有:输入单元,麦克风信号和一维时间序列信号输入到该输入单元,所述麦克风信号包括混合有目标声音和除该目标声音之外的声音的混合声音,并且所述一维时间序列信号与目标声音同步且由辅助传感器获取;以及声源提取单元,基于一维时间序列信号从麦克风信号中提取与目标声音相对应的目标声音信号。CN113661719ACN113661719A权利要求书1/2页1.一种信号处理装置,包括:输入单元,包括混合有目标声音与除所述目标声音之外的声音的混合声音的麦克风信号输入到所述输入单元,并且由辅助传感器获取并与所述目标声音同步的一维时间序列信号输入到所述输入单元;以及声源提取单元,基于所述一维时间序列信号从所述麦克风信号中提取与所述目标声音相对应的目标声音信号。2.根据权利要求1所述的信号处理装置,其中,所述声源提取单元使用基于所述一维时间序列信号生成的教学信息来提取所述目标声音信号。3.根据权利要求1所述的信号处理装置,其中,所述辅助传感器包括附接到所述目标声音的源的传感器。4.根据权利要求1所述的信号处理装置,其中,所述麦克风信号包括由第一麦克风检测的信号,并且所述辅助传感器包括与所述第一麦克风不同的第二麦克风。5.根据权利要求4所述的信号处理装置,其中,所述第一麦克风包括设置在耳机的壳体的外部的麦克风,并且所述第二麦克风包括设置在所述壳体的内部的麦克风。6.根据权利要求1所述的信号处理装置,其中,所述辅助传感器包括检测在体内传播的声波的传感器。7.根据权利要求1所述的信号处理装置,其中,所述辅助传感器包括检测除声波之外的信号的传感器。8.根据权利要求7所述的信号处理装置,其中,所述辅助传感器包括检测肌肉的运动的传感器。9.根据权利要求1所述的信号处理装置,还包括:再现单元,再现由所述声源提取单元提取的所述目标声音信号。10.根据权利要求1所述的信号处理装置,还包括:通信单元,将由所述声源提取单元提取的所述目标声音信号发送到外部装置。11.根据权利要求1所述的信号处理装置,还包括:话语区段估计单元,基于所述声源提取单元的提取结果来估计指示话语存在或不存在的话语区段,并且生成话语区段信息作为估计结果;以及语音识别单元,在所述话语区段中执行语音识别。12.根据权利要求1所述的信号处理装置,其中,所述声源提取单元还被配置作为声源提取/话语区段估计单元,所述声源提取/话语区段估计单元估计指示话语存在或不存在的话语区段,并且生成话语区段信息作为估计结果,并且所述声源提取/话语区段估计单元输出所述目标声音信号和所述话语区段信息。13.根据权利要求12所述的信号处理装置,还包括区段外消音单元,基于从所述声源提取/话语区段估计单元输出的所述话语区段信息,确定与所述目标声音信号中的所述话语区段之外的时间相对应的声音信号,并且使所确定2CN113661719A权利要求书2/2页的声音信号消音。14.根据权利要求1所述的信号处理装置,其中,所述声源提取单元包括提取模型单元,所述提取模型单元接收基于所述麦克风信号的第一特征量和基于所述一维时间序列信号的第二特征量作为输入、对所述输入执行前向传播处理、并且输出一输出特征量。15.根据权利要求1所述的信号处理装置,其中,所述声源提取单元包括提取/检测模型单元,所述提取/检测模型单元接收基于所述麦克风信号的第一特征量和基于所述一维时间序列信号的第二特征量作为输入、对所述输入执行前向传播处理、并且输出多个输出特征量。16.根据权利要求14所述的信号处理装置,还包括:重构单元,基于所述输出特征量至少生成所述目标声音信号。17.根据权利要求14所述的信号处理装置,其中,输入特征量与所述输出特征量之间的对