预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110728133A(43)申请公布日2020.01.24(21)申请号201911314319.0(22)申请日2019.12.19(71)申请人北京海天瑞声科技股份有限公司地址100083北京市海淀区成府路28号优盛大厦D801(72)发明人杨福星郝玉峰黄宇凯邵志明曹琼李科(74)专利代理机构北京钲霖知识产权代理有限公司11722代理人熊玉兰田飞飞(51)Int.Cl.G06F40/211(2020.01)G10L13/02(2013.01)G10L13/04(2013.01)权利要求书3页说明书8页附图3页(54)发明名称个性语料获取方法及个性语料获取装置(57)摘要本发明涉及语音合成技术领域,提供一种个性语料获取方法及个性语料获取装置。个性语料获取方法,包括:获取待选语句集,待选语句集包括至少一个待选语句。获取录音者的个人属性信息。基于待选语句和个人属性信息,得到待选语句与录音者之间的适配值。根据适配值,判断待选语句是否保留。根据判断待选语句是否保留的判断结果,得到适配于录音者的个性语料,其中,个性语料由待选语句集中保留的待选语句组成。通过本公开提供的个性语料获取方法,能够根据待选语句自身的易读性和录音者的个人属性信息,筛选适合录音者的待选语句,进而获得适合录音者的个性语料。有助于提高录音者的录音流畅度,进而提升录音效率,从而提高语音合成数据库的质量。CN110728133ACN110728133A权利要求书1/3页1.一种个性语料获取方法,其中,所述方法包括:获取待选语句集,所述待选语句集包括至少一个待选语句;获取录音者的个人属性信息;基于所述待选语句和所述个人属性信息,得到所述待选语句与所述录音者之间的适配值;根据所述适配值,判断所述待选语句是否保留;根据所述判断所述待选语句是否保留的判断结果,得到适配于所述录音者的个性语料,其中,所述个性语料由所述待选语句集中保留的所述待选语句组成。2.根据权利要求1所述的方法,其中,所述基于所述待选语句和所述个人属性信息,得到所述待选语句与所述录音者之间的适配值,包括:根据所述待选语句,获取所述待选语句易读性的易读值;基于所述易读值和所述个人属性信息,得到所述待选语句与所述录音者之间的适配值。3.根据权利要求2所述的方法,其中,所述根据所述待选语句,获取所述待选语句易读性的易读值,包括:根据所述待选语句,得到所述待选语句的从属领域;根据所述从属领域,得到所述待选语句的所述易读值。4.根据权利要求3所述的方法,其中,所述根据所述待选语句,获取所述待选语句易读性的易读值,还包括:基于所述待选语句的语序,通过语言模型,得到所述待选语句的逻辑合理度;根据所述逻辑合理度,得到所述待选语句的所述易读值。5.根据权利要求4所述的方法,其中,所述根据所述待选语句,获取所述待选语句易读性的易读值,还包括:基于所述待选语句的句长和/或生僻字,得到所述待选语句易读性的易读值。6.根据权利要求4所述的方法,其中,所述基于所述易读值和所述个人属性信息,得到所述待选语句与所述录音者之间的适配值,包括:将所述待选语句的所述从属领域、所述易读值和所述个人属性信息输入至适配预测模型;通过所述适配预测模型,得到所述适配值。7.根据权利要求6所述方法,其中,所述个人属性信息包括以下至少一项:性别、年龄、籍贯、普通话等级和是否有过播音训练。8.根据权利要求7所述的方法,其中,所述根据所述适配值,判断所述待选语句是否保留,包括:将所述适配值与预设阈值进行对比,当所述适配值小于或等于所述阈值时,则保留所述待选语句;当所述适配值大于所述阈值时,则舍弃所述待选语句。9.根据权利要求7所述的方法,其中,所述根据所述适配值,判断所述待选语句是否保留,包括:将所述待选语句集中的所述待选语句根据适配值的大小,从小到大进行排序,按序保留与预设数量阈值相同的多个所述待选语句。2CN110728133A权利要求书2/3页10.一种个性语料获取装置,其中,所述装置包括:获取模块,用于获取待选语句集、获取录音者的个人属性信息,并基于所述待选语句和所述个人属性信息,得到所述待选语句与所述录音者之间的适配值;还用于根据判断所述待选语句是否保留的判断结果,得到适配于所述录音者的个性语料,其中,所述待选语句集包括至少一个待选语句,所述个性语料由所述待选语句集中保留的所述待选语句组成;判断模块,用于根据所述适配值,判断所述待选语句是否保留。11.根据权利要求10所述的装置,其中,所述获取模块采用下述方式基于所述待选语句和所述个人属性信息,得到所述待选语句与所述录音者之间的适配值:根据所述待选语句,获取所述待选语句易读性的易读值;基于所述易读值和所述个人属性信息,得到所述待选语