预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113763918A(43)申请公布日2021.12.07(21)申请号202110946429.X(22)申请日2021.08.18(71)申请人单百通地址100082北京市海淀区永丰产业基地丰润东路12号院(72)发明人单百通(74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙)11463代理人蒋姗(51)Int.Cl.G10L13/02(2013.01)G10L13/033(2013.01)权利要求书2页说明书9页附图2页(54)发明名称文本语音转化方法、装置、电子设备及可读存储介质(57)摘要本申请提供了一种文本语音转化方法、装置、电子设备及可读存储介质,其中,该方法包括:根据配置信息,为待处理文本配置目标语音属性,所述配置信息包括所述目标语音属性;获取语音数据库中所述待处理文本对应的音频文件;根据所述目标语音属性,播放所述音频文件。本申请通过为待处理文本配置相应的目标语音属性,使得通过语音属性实现对待处理文本的播放进行控制,以实现音频输出的声音富有人类情感,能够逼真的模拟人类的声音。CN113763918ACN113763918A权利要求书1/2页1.一种文本语音转化方法,其特征在于,包括:根据配置信息,为待处理文本配置目标语音属性,所述配置信息包括所述目标语音属性;获取语音数据库中所述待处理文本对应的音频文件;根据所述目标语音属性,播放所述音频文件。2.根据权利要求1所述的方法,其特征在于,所述根据配置信息,为待处理文本配置目标语音属性,包括:获取配置信息,所述配置信息中包括目标语言属性,所述目标语言属性为基本属性、性别属性、年龄属性、性格属性、情绪属性和状态属性中的一种或多种属性;根据所述配置信息,为所述待处理文本中的文字分别配置对应的所述目标语音属性。3.根据权利要求1所述的方法,其特征在于,所述根据配置信息,为待处理文本配置目标语音属性,包括:获取配置操作;根据所述配置操作确定出待处理文本中的文字信息对应的配置信息;根据所述配置信息,为待处理文本中的各个文字信息配置对应的目标语音属性;所述根据所述目标语音属性,播放所述音频文件,包括:根据所述待处理文本中的文字信息对应的目标语音属性,播放所述待处理文本中的文字信息对应的音频文件。4.根据权利要求3所述的方法,其特征在于,所述待处理文本包括第一段文字和第二段文字,所述第一段文字对应的目标语音属性为第一语音属性模式,所述第二段文字对应的目标语音属性为第二语音属性模式;所述根据所述待处理文本中的文字信息对应的目标语音属性,播放所述待处理文本中的文字信息对应的音频文件,包括:以所述第一语音属性模式,播放所述第一段文字对应的音频文件;当播放至第二段文字对应的音频文件时,切换至所述第二语音属性模式,以所述第二语音属性模式,播放所述第二段文字对应的音频文件。5.根据权利要求1所述的方法,其特征在于,所述获取语音数据库中所述待处理文本对应的音频文件之后,包括:生成临时音频文件,所述临时音频文件为一个或多个;将所述临时音频文件缓存于音频文件暂存区;所述根据所述目标语音属性,播放所述音频文件,包括:根据所述目标语音属性,播放所述音频文件暂存区中缓存的所述临时音频文件。6.根据权利要求5所述的方法,其特征在于,所述音频文件暂存区包括:多个临时音频文件,所述根据所述目标语音属性,播放所述音频文件暂存区中缓存的所述临时音频文件,包括:根据所述目标语音属性播放所述音频文件暂存区中缓存的第i临时音频文件,所述i为大于等于1,小于等于N‑1的数值,所述N为所述音频文件暂存区中的临时音频文件数量;删除已播放的所述第i临时音频文件;根据所述目标语音属性播放所述音频文件暂存区中缓存的第i+1临时音频文件;删除已播放的所述第i+1临时音频文件;重复上述流程,直至删除所述音频文件暂存区2CN113763918A权利要求书2/2页中的所有临时音频文件。7.根据权利要求1所述的方法,其特征在于,所述播放所述音频文件之后,包括:接收所述待处理文本的播放满意度评分;判断所述满意度评分是否超过设定阈值;若所述满意度评分低于所述设定阈值,根据更新后的配置信息调整所述待处理文本的目标语音属性。8.一种文本语音转化装置,其特征在于,包括:配置模块,用于根据配置信息,为待处理文本配置目标语音属性,所述配置信息包括所述目标语音属性;获取模块,用于获取语音数据库中所述待处理文本对应的音频文件;播放模块,用于根据所述目标语音属性,播放所述音频文件。9.一种电子设备,其特征在于,包括:处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的方法的步骤。1