预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113936645A(43)申请公布日2022.01.14(21)申请号202111185730.X(22)申请日2021.10.12(71)申请人上海深聪半导体有限责任公司地址200232上海市徐汇区丰谷路315弄24号1-3层申请人深聪半导体(珠海)有限责任公司(72)发明人王年(74)专利代理机构上海汉声知识产权代理有限公司31236代理人胡晶(51)Int.Cl.G10L15/06(2013.01)G10L15/22(2006.01)权利要求书2页说明书9页附图3页(54)发明名称一种误唤醒音频采集方法、系统、装置及存储介质(57)摘要本发明公开了一种误唤醒音频采集方法、系统、装置及存储介质,该方法包括:S100:接收并存储环境音频;S200:接收多个唤醒日志;所述唤醒日志配置为利用多个带有语音识别功能的处理器根据预设的触发唤醒策略,在同等环境下分别对同一音源的所述环境音频执行唤醒操作后,生成的多个唤醒日志;S300:基于时间序列中的同一时间段,根据预设的误唤醒策略,将多个所述唤醒日志组合为数据源进行分析判断,根据判断结果从所述环境音频中提取造成误唤醒的各段音频数据。采用本发明获取的误唤醒音频,缩短了音频时长,减少音频占用空间,增加训练数据量,提高识别结果的精度的目的。CN113936645ACN113936645A权利要求书1/2页1.一种误唤醒音频采集方法,其特征在于,所述方法包括:S100:接收并存储环境音频;S200:接收多个唤醒日志;所述唤醒日志配置为利用带有语音识别功能的多个相同设备根据预设的触发唤醒策略,在同等环境下分别对同一音源的所述环境音频执行唤醒操作后,生成的多个唤醒日志;S300:基于时间序列中的同一时间段,根据预设的误唤醒策略,将多个所述唤醒日志组合为数据源进行分析判断,根据判断结果从所述环境音频中提取造成误唤醒的各段音频数据。2.如权利要求1所述的误唤醒音频采集方法,其特征在于,所述步骤S300中的所述误唤醒策略配置为,当数据源中所有的所述唤醒日志的触发唤醒结果一致时,则将当前时间段内的环境音频判定为正常音频,并在接收到下一时间段的环境音频时,将当前时间段的环境音频覆盖丢弃处理;当数据源中任一所述唤醒日志的触发唤醒结果与其他所述唤醒日志结果不一致时,则将当前时间段内的环境音频判定为异常音频,并提取异常音频所属时间段,从所述环境音频中提取音频数据。3.如权利要求1或2所述的误唤醒音频采集方法,其特征在于,所述步骤S300中的所述误唤醒策略配置为,将所述唤醒日志通过0或1表示各所述设备的触发唤醒结果;其中,1表示设备触发唤醒成功,0表示设备触发唤醒失败,使得当组成的数据源中唤醒日志的触发唤醒结果均为1或者均为0时,则表示所有的所述设备在同一时间段同时触发唤醒成功或者同时触发唤醒失败,当前时间段的环境音频判定为正常音频;否则当前时间段的环境音频判定为异常音频。4.如权利要求2所述的误唤醒音频采集方法,其特征在于,所述步骤S300中从环境音频中提取造成误唤醒的各段音频数据的方法为,对存储的所述环境音频进行切割处理;其中,当判断结果表示环境音频中出现异常音频时,对异常音频所属时间段的环境音频进行前延及后延切割处理。5.如权利要求1所述的误唤醒音频采集方法,其特征在于,在所述步骤S100中,接收并存储的环境音频的音源为实际场景下产生的环境音频,或者为音频播放设备模拟的各类场所的环境音频。6.一种误唤醒音频采集系统,其特征在于,采用权利要求1‑5中任意一项所述的误唤醒音频采集方法,所述系统包括:主机、音源、收音设备、带有语音识别功能的多台相同的语音识别设备;所述主机通过通信串口连接各所述语音识别设备,通过音频端口连接所述收音设备;所述音源配置为输出环境音频;所述收音设备配置为实时录制所述环境音频,并将所述环境音频传输给所述主机;所述语音识别设备配置为同步采集并识别同一所述音源的环境音频,基于预设的触发唤醒策略,执行唤醒操作,生成多个唤醒日志,并传输给所述主机;所述主机配置为基于时间序列中的同一时间段,根据预设的误唤醒策略,将多个所述唤醒日志组合为数据源进行分析判断,根据判断结果从环境音频中提取造成误唤醒的各段2CN113936645A权利要求书2/2页音频数据。7.一种误唤醒音频采集装置,其特征在于,采用权利要求1‑5中任意一项所述的误唤醒音频采集方法,所述装置包括:环境音频获取模块,配置为控制多个传声器通过对应的拾音孔同步采集同等环境同一音源的环境音频;唤醒日志获取模块,配置为控制带有语音识别功能的多个相同的语音识别器,根据预设的触发唤醒策略,分别对所述环境音频执行唤醒操作后,提取生成的多个唤醒日志;其中,所述传声器与所述语音识