在话音合成中消除同形异音词的歧义-豆柴文库

在话音合成中消除同形异音词的歧义.pdf

2023-06-10

10金币

1.7MB

45页

一条****涛k

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共45页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105702248A(43)申请公布日2016.06.22(21)申请号201510855408.1(22)申请日2015.11.30(30)优先权数据62/089,4642014.12.09US14/569,5172014.12.12US(71)申请人苹果公司地址美国加利福尼亚(72)发明人C·亨顿D·奈克(74)专利代理机构中国国际贸易促进委员会专利商标事务所11038代理人刘凤香(51)Int.Cl.G10L13/04(2013.01)G10L13/08(2013.01)权利要求书4页说明书33页附图7页(54)发明名称在话音合成中消除同形异音词的歧义(57)摘要本发明公开了在话音合成中消除同形异音词的歧义。提供了用于在话音合成中消除同形异音词的歧义的系统和处理。在一种示例性处理中，可以接收来自用户的包含同形异音词的话音输入。可以利用自动话音辨识系统对话音输入进行处理，以便确定对应于用户在话音输入中所发音的同形异音词的音素串。可以基于所述音素串或者利用自动话音辨识系统的n元语法语言模型的至少其中之一来确定同形异音词的正确发音。可以生成针对话音输入的对话响应，其中所述对话响应可以包括同形异音词。可以输出对话响应以作为话音输出。可以根据所述正确发音在话音输出中发音对话响应中的同形异音词。CN105702248ACN105702248A权利要求书1/4页1.一种用于操作智能自动化助理的方法，所述方法包括：在具有处理器和存储有供处理器执行的一个或多个程序的存储器的电子设备处：接收来自用户的包含同形异音词以及一个或多个附加单词的话音输入；利用自动话音辨识系统对话音输入进行处理，以确定以下各项的至少其中之一：对应于由用户在话音输入中发音的同形异音词的音素串；以及n元语法关于语料库的出现频率，其中，所述n元语法包括所述同形异音词以及一个或多个附加单词；基于所述音素串和n元语法的出现频率的至少其中之一确定同形异音词的正确发音；生成针对话音输入的对话响应，其中所述对话响应包括所述同形异音词；以及输出对话响应以作为话音输出，其中根据所确定的正确发音在话音输出中发音对话响应中的同形异音词。2.根据权利要求1所述的方法，其中，利用自动话音辨识系统处理话音输入包括确定对应于话音输入的文本串，并且所述方法还包括：基于所述文本串确定可行动意图，其中基于所述音素串、n元语法的出现频率和可行动意图的至少其中之一确定同形异音词的正确发音。3.根据权利要求2所述的方法，还包括：把同形异音词指派到可行动意图的一个参数，其中至少部分地基于所述参数确定同形异音词的正确发音。4.根据权利要求2所述的方法，其中：词汇表列表与可行动意图相关联；词汇表列表包括同形异音词；词汇表列表中的同形异音词与特定发音相关联；并且基于与词汇表列表中的同形异音词相关联的特定发音确定同形异音词的正确发音。5.根据权利要求2所述的方法，还包括：接收与话音输入相关联的情境信息，其中至少部分地基于情境信息确定可行动意图。6.根据权利要求1所述的方法，其中：所述n元语法中的同形异音词与第一发音相关联；利用自动话音辨识系统处理话音输入包括确定第二n元语法关于语料库的出现频率；第二n元语法包括所述同形异音词以及一个或多个附加单词；第二n元语法中的同形异音词与第二发音相关联；并且基于所述n元语法的出现频率和所述第二n元语法的出现频率确定同形异音词的正确发音。7.根据权利要求6所述的方法，其中，所述n元语法的出现频率比第二n元语法的出现频率高至少预定数量，并且其中把同形异音词的正确发音确定为第一发音。8.根据权利要求6所述的方法，其中，第一n元语法的出现频率高于第一预定阈值，第二n元语法的出现频率低于第二预定阈值，并且其中把同形异音词的正确发音确定为第一发音。9.根据权利要求6所述的方法，其中，所述音素串对应于第二发音，所述n元语法的出现频率比所述第二n元语法的出现频率高至少预定数量，并且其中把同形异音词的正确发音2CN105702248A权利要求书2/4页确定为第一发音。10.根据权利要求1所述的方法，还包括：从自动话音辨识系统获得对应于所确定的正确发音的第二音素串，其中输出对话响应包括利用话音合成器合成对话响应中的同形异音词，并且其中所述话音合成器使用第二音素串根据所述正确发音合成话音输出中的同形异音词。11.根据权利要求1所述的方法，还包括：利用标签注释对话响应中的同形异音词以标识出同形异音词的正确发音，其中输出对话响应包括利用话音合成器合成对话响应中的同形异音词，并且其中基于所述标签合成对话响应中的同形异音词。12.根据权利要求1所述的方法，还包括：接收与话音输入相关联的情境信息，其中至少部分地基于所述情境信息确定同形异

相关资料

在话音合成中消除同形异音词的歧义.pdf

本发明公开了在话音合成中消除同形异音词的歧义。提供了用于在话音合成中消除同形异音词的歧义的系统和处理。在一种示例性处理中，可以接收来自用户的包含同形异音词的话音输入。可以利用自动话音辨识系统对话音输入进行处理，以便确定对应于用户在话音输入中所发音的同形异音词的音素串。可以基于所述音素串或者利用自动话音辨识系统的n元语法语言模型的至少其中之一来确定同形异音词的正确发音。可以生成针对话音输入的对话响应，其中所述对话响应可以包括同形异音词。可以输出对话响应以作为话音输出。可以根据所述正确发音在话音输出中发音对话

2023-06-10

1.7MB

句子语境中同形歧义词的歧义消解.docx

句子语境中同形歧义词的歧义消解同形歧义词在日常交流中经常出现，尤其是在中文语境下。同形歧义词是指在拼音或汉字表现形式上相同，但意思不同的词语。因此，在交流中，如果没有进行及时的歧义消解，会给句子的理解和语义的传递带来困难。本文将探讨同形歧义词在句子语境中的歧义消解问题，并尝试解决这个问题的方法。首先，同形歧义词在句子语境中的歧义消解需要考虑上下文环境。句子中的其他词语及其语序可以帮助我们识别出同形歧义词的具体含义。以“公元”为例，如果出现在“小明是公元前出生的人”这个句子中，意思就是公元前；而如果出现在“

2024-11-22

10KB

自动标引中的歧义词消除方法研究.docx

自动标引中的歧义词消除方法研究标题：自动标引中的歧义词消除方法研究摘要：随着信息量的爆炸增长，标引成为了处理大规模文本数据的重要技术之一。然而，自动标引中常常遇到歧义词的问题，即同一个词汇在不同上下文下具有不同的语义。歧义词消除是提高自动标引准确性和信息检索效果的关键问题，因此本论文围绕自动标引中的歧义词消除方法进行研究，旨在提出一种有效的解决方案。1.引言自动标引是对文本进行自动化处理和索引的过程，对提高信息检索效率和准确性具有重要意义。然而，在自动标引过程中，由于语言的复杂性和多义词的存在，歧义词成为

2024-10-31

10KB

歧义句的类型及消除歧义的方法.doc

歧义句的类型及消除歧义的方法（教案）湖南岳云中学王丽纯一导入1、做脑筋急转弯题有个字千百年来都读错，请问是什么字？（“错”）2、猜字谜“李”字去了木是什么字？（“子”“一”）一个词、短语、句子表示两种或两种以上的意义，是语言的多义现象，运用得当能增添语言的趣味性。如：唐时汪伦想邀请诗人李白到自己居住的地方游玩，于是寄了一封信给李白，信中写道：“先生好游乎？此地有十里桃花，先生好饮乎？此地有万家酒店。喜欢游山玩水和饮酒的李白，听汪伦说那里有遍地桃花，又有万多家酒店，十分向往，于是欣然赴约。谁知到达之后却看不

歧义句的类型及消除歧义的方法.doc