音频信息提取的方法、装置、电子设备及可读存储介质-豆柴文库

音频信息提取的方法、装置、电子设备及可读存储介质.pdf

2023-07-24

10金币

731KB

23页

觅松****哥哥

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共23页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114255751A(43)申请公布日2022.03.29(21)申请号202111499605.6G10L25/51(2013.01)(22)申请日2021.12.09(71)申请人阳光保险集团股份有限公司地址518000广东省深圳市福田区红荔西路7002号第一世界广场A座17层(72)发明人王建辉杜新凯吕超李亚楠王军(74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙)11463代理人李飞(51)Int.Cl.G10L15/22(2006.01)G10L15/26(2006.01)G10L15/183(2013.01)G10L25/03(2013.01)权利要求书2页说明书16页附图4页(54)发明名称音频信息提取的方法、装置、电子设备及可读存储介质(57)摘要本申请属于数据处理技术领域，公开了音频信息提取的方法、装置、电子设备及可读存储介质，该方法包括，对目标音频进行文本转换，获得音频文本；对音频文本进行角色划分，分别获得每一对话角色的对话集合，对话集合中至少包含一句对话；分别对每一对话角色的对话集合中的每一对话进行时间划分，获得各对话角色的对话时间信息；根据各对话角色的对话集合和对话时间信息，以及判定条件，对音频文本进行数据判定，获得目标判定内容。这样，就可以在进行音频信息提取时，可以提高音频信息提取的效率和准确率。CN114255751ACN114255751A权利要求书1/2页1.一种音频信息提取的方法，其特征在于，包括：对目标音频进行文本转换，获得音频文本；对所述音频文本进行角色划分，分别获得每一对话角色的对话集合，所述对话集合中至少包含一句对话；分别对每一对话角色的对话集合中的每一对话进行时间划分，获得各对话角色的对话时间信息；根据各对话角色的对话集合和对话时间信息，以及判定条件，对所述音频文本进行数据判定，获得目标判定内容。2.如权利要求1所述的方法，其特征在于，所述对所述音频文本进行角色划分，分别获得每一对话角色的对话集合，包括：按照指定字符，将所述音频文本进行划分，获得至少一个对话；采用预先训练好的角色划分模型，分别确定每一对话的发言人，分别为每一对话角色的角色概率；分别针对每一对话，执行以下步骤：确定一个对话对应的各角色概率中的最大值；将所述一个对话，添加到所述最大值对应的对话角色的对话集合中。3.如权利要求2所述的方法，其特征在于，所述采用预先训练好的角色划分模型，分别确定每一对话的发言人，分别为每一对话角色的角色概率，包括：按照指定对话数量，将所述至少一个对话进行划分，获得至少一个对话组；分别针对每一对话组，执行以下步骤：分别将所述一个对话组中的每一对话，输入至预先训练好的角色划分模型，分别获得每一对话分别为每一对话角色的初始角色概率；分别将相同对话角色的每一对话的各初始角色概率进行加权求和；分别将相同对话角色的每一对话的加权求和结果，确定为所述一个对话组中的对应的对话的相应对话角色的角色概率。4.如权利要求1‑3任一项所述的方法，其特征在于，所述分别对每一对话角色的对话集合中的每一对话进行时间划分，获得各对话角色的对话时间信息，包括：对各对话角色的对话集合中的各对话进行时间划分，分别获得每一对话的对话时间区间；根据各对话对应的对话时间区间，以及每一对话中包含的字符数量，分别确定每一字符的字符时间区间；根据各对话的对话时间区间，以及各字符的字符时间区间，获得所述对话时间信息。5.如权利要求4所述的方法，其特征在于，所述对各对话角色的对话集合中的各对话进行时间划分，分别获得每一对话的对话时间区间，包括：若确定不同对话角色的对话时间区间存在重叠，则按照指定字符，将存在重叠的对话进行划分，分别获得所述重叠的对话的多个子对话；分别获取每一子对话对应的对话时间区间；基于所述多个子对话对应的对话时间区间，对各对话的对话时间区间进行更新。6.如权利要求4所述的方法，其特征在于，所述根据各对话对应的对话时间区间，以及2CN114255751A权利要求书2/2页每一对话中包含的字符数量，分别确定每一字符的字符时间区间，包括：分别针对所述音频文本中的每一对话，执行以下步骤：根据一个对话的对话时间区间，以及所述一个对话的中包含的字符数量，确定所述一个对话中每一字符的平均字符时间长度；按照所述平均字符时间长度，将所述一个对话的对话时间区间进行划分，分别获得每一字符的字符时间区间。7.如权利要求5或6所述的方法，其特征在于，所述判定条件包括第一判定条件和第二判定条件，所述第一判定条件包括第一判定元素和第一对话角色，第二判定条件包括第二判定元素、第二对话角色以及设定判定时长，所述根据各对话角色的对话集合和对话时间信息，以及判定条件，对所述音频

相关资料

音频信息提取的方法、装置、电子设备及可读存储介质.pdf

本申请属于数据处理技术领域，公开了音频信息提取的方法、装置、电子设备及可读存储介质，该方法包括，对目标音频进行文本转换，获得音频文本；对音频文本进行角色划分，分别获得每一对话角色的对话集合，对话集合中至少包含一句对话；分别对每一对话角色的对话集合中的每一对话进行时间划分，获得各对话角色的对话时间信息；根据各对话角色的对话集合和对话时间信息，以及判定条件，对音频文本进行数据判定，获得目标判定内容。这样，就可以在进行音频信息提取时，可以提高音频信息提取的效率和准确率。

2023-07-24

731KB

音频播放方法、装置、电子设备及可读存储介质.pdf

本申请提供了一种音频播放方法、装置、电子设备及可读存储介质,所述音频播放方法包括:若接收到音频播放应用的待播放音频文件,则检测所述音频播放应用对应的应用类型和所述待播放音频文件对应的应用音效类型;依据所述应用类型和所述应用音效类型,为所述待播放音频文件匹配对应的附加音效;根据所述附加音效,播放所述待播放音频文件。本申请解决了现有技术中用户的听音体验差的技术问题。

2023-04-19

542KB

音频处理方法、装置、电子设备及可读存储介质.pdf

本公开实施例公开了一种音频处理方法、装置、电子设备和可读存储介质。该音频处理方法包括：获取第一麦克风采集的第一音频数据和第二麦克风采集的与所述第一音频数据相对应的第二音频数据；确定所述第一音频数据和所述第二音频数据的主音源方位；基于所述第一音频数据、第二音频数据以及所述主音源方位确定目标噪音比，所述目标噪音比表示所述第一音频数据和所述第二音频数据各自的期望信号能量与非期望信号能量的比值；以及，基于所述目标噪音比，对所述第一音频数据和/或第二音频数据进行滤波并基于滤波后的第一音频数据和/或第二音频数据获取目

2023-07-25

1.2MB

音频处理方法、装置、电子设备及可读存储介质.pdf

本申请公开了一种音频处理方法、装置、电子设备及可读存储介质，属于音频处理技术领域。其中，由终端执行的方法包括：获取第一人声音频和环境声音频；根据所述第一人声音频的信息量、所述环境声音频的信息量和所述终端的算力状态，确定是否向云端服务器发送所述第一人声音频和所述环境声音频，以及音频处理请求，所述音频处理请求用于请求所述云端服务器对所述第一人声音频和所述环境声音频进行降噪处理，以获取所述第一人声音频对应的目标声纹信息。能够使终端及时进行降噪处理，提高声纹识别的效率。

2023-07-25

515KB

音频播放方法、装置、电子设备和可读存储介质.pdf

本公开提供了一种音频播放方法、装置、电子设备和可读存储介质，涉及语音处理、深度学习等人工智能技术领域。音频播放方法包括：获取待播放语句；根据所述待播放语句的文本内容，得到所述待播放语句的语音情感、语音音色、场景音效与背景音乐；使用所述语音情感与语音音色，生成所述待播放语句的目标音频；播放所述目标音频，并播放所述场景音效与背景音乐。本公开能够提升在音频播放时的用户听感，增强音频播放的真实性与生动性。

2023-07-25

475KB