预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共45页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105702248A(43)申请公布日2016.06.22(21)申请号201510855408.1(22)申请日2015.11.30(30)优先权数据62/089,4642014.12.09US14/569,5172014.12.12US(71)申请人苹果公司地址美国加利福尼亚(72)发明人C·亨顿D·奈克(74)专利代理机构中国国际贸易促进委员会专利商标事务所11038代理人刘凤香(51)Int.Cl.G10L13/04(2013.01)G10L13/08(2013.01)权利要求书4页说明书33页附图7页(54)发明名称在话音合成中消除同形异音词的歧义(57)摘要本发明公开了在话音合成中消除同形异音词的歧义。提供了用于在话音合成中消除同形异音词的歧义的系统和处理。在一种示例性处理中,可以接收来自用户的包含同形异音词的话音输入。可以利用自动话音辨识系统对话音输入进行处理,以便确定对应于用户在话音输入中所发音的同形异音词的音素串。可以基于所述音素串或者利用自动话音辨识系统的n元语法语言模型的至少其中之一来确定同形异音词的正确发音。可以生成针对话音输入的对话响应,其中所述对话响应可以包括同形异音词。可以输出对话响应以作为话音输出。可以根据所述正确发音在话音输出中发音对话响应中的同形异音词。CN105702248ACN105702248A权利要求书1/4页1.一种用于操作智能自动化助理的方法,所述方法包括:在具有处理器和存储有供处理器执行的一个或多个程序的存储器的电子设备处:接收来自用户的包含同形异音词以及一个或多个附加单词的话音输入;利用自动话音辨识系统对话音输入进行处理,以确定以下各项的至少其中之一:对应于由用户在话音输入中发音的同形异音词的音素串;以及n元语法关于语料库的出现频率,其中,所述n元语法包括所述同形异音词以及一个或多个附加单词;基于所述音素串和n元语法的出现频率的至少其中之一确定同形异音词的正确发音;生成针对话音输入的对话响应,其中所述对话响应包括所述同形异音词;以及输出对话响应以作为话音输出,其中根据所确定的正确发音在话音输出中发音对话响应中的同形异音词。2.根据权利要求1所述的方法,其中,利用自动话音辨识系统处理话音输入包括确定对应于话音输入的文本串,并且所述方法还包括:基于所述文本串确定可行动意图,其中基于所述音素串、n元语法的出现频率和可行动意图的至少其中之一确定同形异音词的正确发音。3.根据权利要求2所述的方法,还包括:把同形异音词指派到可行动意图的一个参数,其中至少部分地基于所述参数确定同形异音词的正确发音。4.根据权利要求2所述的方法,其中:词汇表列表与可行动意图相关联;词汇表列表包括同形异音词;词汇表列表中的同形异音词与特定发音相关联;并且基于与词汇表列表中的同形异音词相关联的特定发音确定同形异音词的正确发音。5.根据权利要求2所述的方法,还包括:接收与话音输入相关联的情境信息,其中至少部分地基于情境信息确定可行动意图。6.根据权利要求1所述的方法,其中:所述n元语法中的同形异音词与第一发音相关联;利用自动话音辨识系统处理话音输入包括确定第二n元语法关于语料库的出现频率;第二n元语法包括所述同形异音词以及一个或多个附加单词;第二n元语法中的同形异音词与第二发音相关联;并且基于所述n元语法的出现频率和所述第二n元语法的出现频率确定同形异音词的正确发音。7.根据权利要求6所述的方法,其中,所述n元语法的出现频率比第二n元语法的出现频率高至少预定数量,并且其中把同形异音词的正确发音确定为第一发音。8.根据权利要求6所述的方法,其中,第一n元语法的出现频率高于第一预定阈值,第二n元语法的出现频率低于第二预定阈值,并且其中把同形异音词的正确发音确定为第一发音。9.根据权利要求6所述的方法,其中,所述音素串对应于第二发音,所述n元语法的出现频率比所述第二n元语法的出现频率高至少预定数量,并且其中把同形异音词的正确发音2CN105702248A权利要求书2/4页确定为第一发音。10.根据权利要求1所述的方法,还包括:从自动话音辨识系统获得对应于所确定的正确发音的第二音素串,其中输出对话响应包括利用话音合成器合成对话响应中的同形异音词,并且其中所述话音合成器使用第二音素串根据所述正确发音合成话音输出中的同形异音词。11.根据权利要求1所述的方法,还包括:利用标签注释对话响应中的同形异音词以标识出同形异音词的正确发音,其中输出对话响应包括利用话音合成器合成对话响应中的同形异音词,并且其中基于所述标签合成对话响应中的同形异音词。12.根据权利要求1所述的方法,还包括:接收与话音输入相关联的情境信息,其中至少部分地基于所述情境信息确定同形异