一种误唤醒音频采集方法、系统、装置及存储介质-豆柴文库

一种误唤醒音频采集方法、系统、装置及存储介质.pdf

2023-07-24

10金币

628KB

15页

星星****眨眼

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共15页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113936645A(43)申请公布日2022.01.14(21)申请号202111185730.X(22)申请日2021.10.12(71)申请人上海深聪半导体有限责任公司地址200232上海市徐汇区丰谷路315弄24号1-3层申请人深聪半导体（珠海）有限责任公司(72)发明人王年(74)专利代理机构上海汉声知识产权代理有限公司31236代理人胡晶(51)Int.Cl.G10L15/06(2013.01)G10L15/22(2006.01)权利要求书2页说明书9页附图3页(54)发明名称一种误唤醒音频采集方法、系统、装置及存储介质(57)摘要本发明公开了一种误唤醒音频采集方法、系统、装置及存储介质，该方法包括：S100：接收并存储环境音频；S200：接收多个唤醒日志；所述唤醒日志配置为利用多个带有语音识别功能的处理器根据预设的触发唤醒策略，在同等环境下分别对同一音源的所述环境音频执行唤醒操作后，生成的多个唤醒日志；S300：基于时间序列中的同一时间段，根据预设的误唤醒策略，将多个所述唤醒日志组合为数据源进行分析判断，根据判断结果从所述环境音频中提取造成误唤醒的各段音频数据。采用本发明获取的误唤醒音频，缩短了音频时长，减少音频占用空间，增加训练数据量，提高识别结果的精度的目的。CN113936645ACN113936645A权利要求书1/2页1.一种误唤醒音频采集方法，其特征在于，所述方法包括：S100：接收并存储环境音频；S200：接收多个唤醒日志；所述唤醒日志配置为利用带有语音识别功能的多个相同设备根据预设的触发唤醒策略，在同等环境下分别对同一音源的所述环境音频执行唤醒操作后，生成的多个唤醒日志；S300：基于时间序列中的同一时间段，根据预设的误唤醒策略，将多个所述唤醒日志组合为数据源进行分析判断，根据判断结果从所述环境音频中提取造成误唤醒的各段音频数据。2.如权利要求1所述的误唤醒音频采集方法，其特征在于，所述步骤S300中的所述误唤醒策略配置为，当数据源中所有的所述唤醒日志的触发唤醒结果一致时，则将当前时间段内的环境音频判定为正常音频，并在接收到下一时间段的环境音频时，将当前时间段的环境音频覆盖丢弃处理；当数据源中任一所述唤醒日志的触发唤醒结果与其他所述唤醒日志结果不一致时，则将当前时间段内的环境音频判定为异常音频，并提取异常音频所属时间段，从所述环境音频中提取音频数据。3.如权利要求1或2所述的误唤醒音频采集方法，其特征在于，所述步骤S300中的所述误唤醒策略配置为，将所述唤醒日志通过0或1表示各所述设备的触发唤醒结果；其中，1表示设备触发唤醒成功，0表示设备触发唤醒失败，使得当组成的数据源中唤醒日志的触发唤醒结果均为1或者均为0时，则表示所有的所述设备在同一时间段同时触发唤醒成功或者同时触发唤醒失败，当前时间段的环境音频判定为正常音频；否则当前时间段的环境音频判定为异常音频。4.如权利要求2所述的误唤醒音频采集方法，其特征在于，所述步骤S300中从环境音频中提取造成误唤醒的各段音频数据的方法为，对存储的所述环境音频进行切割处理；其中，当判断结果表示环境音频中出现异常音频时，对异常音频所属时间段的环境音频进行前延及后延切割处理。5.如权利要求1所述的误唤醒音频采集方法，其特征在于，在所述步骤S100中，接收并存储的环境音频的音源为实际场景下产生的环境音频，或者为音频播放设备模拟的各类场所的环境音频。6.一种误唤醒音频采集系统，其特征在于，采用权利要求1‑5中任意一项所述的误唤醒音频采集方法，所述系统包括：主机、音源、收音设备、带有语音识别功能的多台相同的语音识别设备；所述主机通过通信串口连接各所述语音识别设备，通过音频端口连接所述收音设备；所述音源配置为输出环境音频；所述收音设备配置为实时录制所述环境音频，并将所述环境音频传输给所述主机；所述语音识别设备配置为同步采集并识别同一所述音源的环境音频，基于预设的触发唤醒策略，执行唤醒操作，生成多个唤醒日志，并传输给所述主机；所述主机配置为基于时间序列中的同一时间段，根据预设的误唤醒策略，将多个所述唤醒日志组合为数据源进行分析判断，根据判断结果从环境音频中提取造成误唤醒的各段2CN113936645A权利要求书2/2页音频数据。7.一种误唤醒音频采集装置，其特征在于，采用权利要求1‑5中任意一项所述的误唤醒音频采集方法，所述装置包括：环境音频获取模块，配置为控制多个传声器通过对应的拾音孔同步采集同等环境同一音源的环境音频；唤醒日志获取模块，配置为控制带有语音识别功能的多个相同的语音识别器，根据预设的触发唤醒策略，分别对所述环境音频执行唤醒操作后，提取生成的多个唤醒日志；其中，所述传声器与所述语音识

相关资料

一种误唤醒音频采集方法、系统、装置及存储介质.pdf

本发明公开了一种误唤醒音频采集方法、系统、装置及存储介质，该方法包括：S100：接收并存储环境音频；S200：接收多个唤醒日志；所述唤醒日志配置为利用多个带有语音识别功能的处理器根据预设的触发唤醒策略，在同等环境下分别对同一音源的所述环境音频执行唤醒操作后，生成的多个唤醒日志；S300：基于时间序列中的同一时间段，根据预设的误唤醒策略，将多个所述唤醒日志组合为数据源进行分析判断，根据判断结果从所述环境音频中提取造成误唤醒的各段音频数据。采用本发明获取的误唤醒音频，缩短了音频时长，减少音频占用空间，增加训练

2023-07-24

628KB

未唤醒音频的确定方法及装置、存储介质及电子装置.pdf

本发明公开了一种未唤醒音频的确定方法及装置、存储介质及电子装置，其中，上述方法包括：采集第一目标音频，其中，所述第一目标音频为第一时间采集到的，且所述第一目标音频与标准音频的相似度大于第一预设阈值，所述标准音频用于唤醒目标设备；在确定所述第一目标音频未唤醒所述目标设备的情况下，采集第二目标音频，其中，所述第二目标音频为第二时间采集到的，所述第一时间与所述第二时间的时间间隔小于预设时间，所述第二目标音频与所述标准音频的相似度大于第一预设阈值；在确定所述第二目标音频唤醒所述目标设备的情况下，将所述第一目标音频

2023-07-25

692KB

音频帧的处理方法、系统、装置及存储介质.pdf

本发明公开了一种音频帧的处理方法、系统、装置及存储介质，其中，用于音频帧处理的目标音频模型被拆分为相连的多个局部模型，所述方法包括：获取当前音频帧之前的上一音频帧对应的第一状态参数，并将所述第一状态参数作为所述当前音频帧的输入状态参数；在所述输入状态参数的基础上，利用所述多个局部模型对所述当前音频帧进行处理；在对所述当前音频帧的处理过程中，生成所述当前音频帧的第二状态参数，所述第二状态参数作为所述当前音频帧之后的下一音频帧的输入状态参数。本发明提供的技术方案，能够有效地对音频帧进行实时处理。

2023-07-25

491KB

唤醒操作系统的方法、装置、终端及存储介质.pdf

本申请实施例公开了一种唤醒操作系统的方法、装置、终端及存储介质，属于计算机技术领域，本申请实施例能够获取第一开始时刻，该第一开始时刻是精确闹钟的开始时刻，当第二开始时刻与该第一开始时刻之间满足预设关系时，将第二开始时刻调整至第一开始时刻，第二开始时刻是第一批闹钟的开始时刻，当系统时刻到达第一开始时刻时，唤醒操作系统并通过该操作系统执行精确闹钟对应的任务，以及第一批闹钟对应的任务。由于本申请实施例能够将第一批闹钟的开始时刻调整至精确闹钟的开始时刻，因此，在保证精确闹钟的开始时刻的前提下，能够减少操作系统的唤

2023-10-23

865KB

一种音频录制方法、装置、系统、设备和存储介质.pdf

本公开实施例提供了一种音频录制方法、装置、系统、设备和存储介质。该方法应用于移动客户端，移动客户端通过外置声卡与至少两个音频采集端进行连接，该方法包括：确定外置声卡的数据输出接口对应的目标接口参数信息；获取移动客户端中的目标数据存储空间对应的存储地址信息；将目标接口参数信息和存储地址信息配置到移动客户端的操作系统内核层中；通过操作系统内核层，将每个音频采集端采集到的音频流数据存储至目标数据存储空间中。通过本公开实施例的技术方案，移动客户端可以有效支持多路音频流的录制。

2023-07-21

988KB