预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共34页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114064964A(43)申请公布日2022.02.18(21)申请号202010752345.8G10L25/51(2013.01)(22)申请日2020.07.30(71)申请人华为技术有限公司地址518129广东省深圳市龙岗区坂田华为总部办公楼(72)发明人朱逸程韩卫正(74)专利代理机构北京同立钧成知识产权代理有限公司11205代理人孙静刘芳(51)Int.Cl.G06F16/683(2019.01)G11B27/10(2006.01)G10L15/26(2006.01)G10L15/02(2006.01)G10L15/30(2013.01)权利要求书3页说明书18页附图12页(54)发明名称文本的时间标注方法、装置、电子设备和可读存储介质(57)摘要本申请实施例提供一种文本的时间标注方法、装置、电子设备和可读存储介质,该方法包括:接收标注请求,根据目标音频的基频,获取目标音频中每个文本单元的播放起止时间,且根据目标音频中每个文本单元的播放起止时间,标注文本中每个文本单元的播放起止时间,得到标注文件,输出标注文件。本申请实施例可以通过目标音频中基频识别目标音频对应的文本中相邻两个文本单元之间的时刻,即可以区分该相邻两个文本单元,进而对齐文本单元。而并非采用目前识别文本单元的方式将文本单元对齐,避免了因目标音频中的文本单元和目标音频对应的文本中的文本单元不一致时造成不能进行文本的时间标注的问题,文本的时间标注的准确性高。CN114064964ACN114064964A权利要求书1/3页1.一种文本的时间标注方法,其特征在于,应用于电子设备,所述方法包括:接收标注请求,所述标注请求用于请求标注目标音频对应的文本中每个文本单元的播放起止时间,所述文本单元为如下至少一项:字、单词或词语;根据所述目标音频的基频,获取所述目标音频中每个文本单元的播放起止时间;根据所述目标音频中每个文本单元的播放起止时间,标注所述文本中每个文本单元的播放起止时间,得到标注文件;输出所述标注文件。2.根据权利要求1所述的方法,其特征在于,所述根据所述目标音频的基频,获取所述目标音频中每个文本单元的播放起止时间,包括:根据所述目标音频的基频和所述目标音频的短时能量,获取所述目标音频中每个文本单元的播放起止时间。3.根据权利要求2所述的方法,其特征在于,所述目标音频由至少一个子音频段组成;所述根据所述目标音频的基频和所述目标音频的短时能量,获取所述目标音频中每个文本单元的播放起止时间,包括:根据所述子音频段的基频,获取所述子音频段中基频的变化率大于变化率阈值的第一时刻;若所述第一时刻的数量大于或等于所述子音频段对应的文本中文本单元的数量,则根据所述子音频段的短时能量,在所述第一时刻中获取第二时刻,相邻两个第二时刻之间的短时能量的均值小于第一短时能量阈值;根据所述第一时刻和所述第二时刻,获取所述子音频段中每个文本单元的播放起止时间,以得到所述目标音频中每个文本单元的播放起止时间。4.根据权利要求3所述的方法,其特征在于,第三时刻为所述第一时刻中除了所述第二时刻之外的时刻,所述根据所述第一时刻和所述第二时刻,获取所述子音频段中每个文本单元的播放起止时间,包括:按照所述第三时刻和所述第二时刻从早到晚的顺序,获取所述子音频段的至少一个第二时刻组,所述第二时刻组由连续的至少两个第二时刻组成,所述第二时刻组相邻的时刻为第三时刻;将每个第三时刻和每个第二时刻组均作为一个时刻单元,得到多个时刻单元;按照时刻单元从早到晚的顺序,获取所述子音频段中每个文本单元的播放起止时间。5.根据权利要求4所述的方法,其特征在于,所述按照时刻单元从早到晚的顺序,获取所述子音频段中每个文本单元的播放起止时间,包括:按照时刻单元从早到晚的顺序,若第i个时刻单元中的时刻为第三时刻,则将所述第i个时刻单元中的第三时刻作为所述子音频段中第i个文本单元的播放终止时间以及第i+1个文本单元的播放起始时间,i为大于或等于1的整数;若所述第i个时刻单元中的时刻为第二时刻组,则将所述第i个时刻单元中第二时刻组中最早的第二时刻作为所述子音频段中第i个文本单元的播放终止时间,且将所述第i个时刻单元中第二时刻组中最晚的第二时刻作为所述子音频段中第i+1个文本单元的播放起始时间。6.根据权利要求1-5中任一项所述的方法,其特征在于,所述标注请求中包括所述目标2CN114064964A权利要求书2/3页音频,所述目标频频为人声音频;或者;所述标注请求中包括初始音频,所述初始音频包括非人声音频和人声音频;所述方法还包括:在所述初始音频中提取人声音频,作为所述目标音频。7.根据权利要求6所述的方法,其特征在于,所述在所述初始音频中提取人声音频