预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114255751A(43)申请公布日2022.03.29(21)申请号202111499605.6G10L25/51(2013.01)(22)申请日2021.12.09(71)申请人阳光保险集团股份有限公司地址518000广东省深圳市福田区红荔西路7002号第一世界广场A座17层(72)发明人王建辉杜新凯吕超李亚楠王军(74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙)11463代理人李飞(51)Int.Cl.G10L15/22(2006.01)G10L15/26(2006.01)G10L15/183(2013.01)G10L25/03(2013.01)权利要求书2页说明书16页附图4页(54)发明名称音频信息提取的方法、装置、电子设备及可读存储介质(57)摘要本申请属于数据处理技术领域,公开了音频信息提取的方法、装置、电子设备及可读存储介质,该方法包括,对目标音频进行文本转换,获得音频文本;对音频文本进行角色划分,分别获得每一对话角色的对话集合,对话集合中至少包含一句对话;分别对每一对话角色的对话集合中的每一对话进行时间划分,获得各对话角色的对话时间信息;根据各对话角色的对话集合和对话时间信息,以及判定条件,对音频文本进行数据判定,获得目标判定内容。这样,就可以在进行音频信息提取时,可以提高音频信息提取的效率和准确率。CN114255751ACN114255751A权利要求书1/2页1.一种音频信息提取的方法,其特征在于,包括:对目标音频进行文本转换,获得音频文本;对所述音频文本进行角色划分,分别获得每一对话角色的对话集合,所述对话集合中至少包含一句对话;分别对每一对话角色的对话集合中的每一对话进行时间划分,获得各对话角色的对话时间信息;根据各对话角色的对话集合和对话时间信息,以及判定条件,对所述音频文本进行数据判定,获得目标判定内容。2.如权利要求1所述的方法,其特征在于,所述对所述音频文本进行角色划分,分别获得每一对话角色的对话集合,包括:按照指定字符,将所述音频文本进行划分,获得至少一个对话;采用预先训练好的角色划分模型,分别确定每一对话的发言人,分别为每一对话角色的角色概率;分别针对每一对话,执行以下步骤:确定一个对话对应的各角色概率中的最大值;将所述一个对话,添加到所述最大值对应的对话角色的对话集合中。3.如权利要求2所述的方法,其特征在于,所述采用预先训练好的角色划分模型,分别确定每一对话的发言人,分别为每一对话角色的角色概率,包括:按照指定对话数量,将所述至少一个对话进行划分,获得至少一个对话组;分别针对每一对话组,执行以下步骤:分别将所述一个对话组中的每一对话,输入至预先训练好的角色划分模型,分别获得每一对话分别为每一对话角色的初始角色概率;分别将相同对话角色的每一对话的各初始角色概率进行加权求和;分别将相同对话角色的每一对话的加权求和结果,确定为所述一个对话组中的对应的对话的相应对话角色的角色概率。4.如权利要求1‑3任一项所述的方法,其特征在于,所述分别对每一对话角色的对话集合中的每一对话进行时间划分,获得各对话角色的对话时间信息,包括:对各对话角色的对话集合中的各对话进行时间划分,分别获得每一对话的对话时间区间;根据各对话对应的对话时间区间,以及每一对话中包含的字符数量,分别确定每一字符的字符时间区间;根据各对话的对话时间区间,以及各字符的字符时间区间,获得所述对话时间信息。5.如权利要求4所述的方法,其特征在于,所述对各对话角色的对话集合中的各对话进行时间划分,分别获得每一对话的对话时间区间,包括:若确定不同对话角色的对话时间区间存在重叠,则按照指定字符,将存在重叠的对话进行划分,分别获得所述重叠的对话的多个子对话;分别获取每一子对话对应的对话时间区间;基于所述多个子对话对应的对话时间区间,对各对话的对话时间区间进行更新。6.如权利要求4所述的方法,其特征在于,所述根据各对话对应的对话时间区间,以及2CN114255751A权利要求书2/2页每一对话中包含的字符数量,分别确定每一字符的字符时间区间,包括:分别针对所述音频文本中的每一对话,执行以下步骤:根据一个对话的对话时间区间,以及所述一个对话的中包含的字符数量,确定所述一个对话中每一字符的平均字符时间长度;按照所述平均字符时间长度,将所述一个对话的对话时间区间进行划分,分别获得每一字符的字符时间区间。7.如权利要求5或6所述的方法,其特征在于,所述判定条件包括第一判定条件和第二判定条件,所述第一判定条件包括第一判定元素和第一对话角色,第二判定条件包括第二判定元素、第二对话角色以及设定判定时长,所述根据各对话角色的对话集合和对话时间信息,以及判定条件,对所述音频