一种语音对话的处理方法和系统-豆柴文库

一种语音对话的处理方法和系统.pdf

2023-05-25

10金币

880KB

28页

一吃****继勇

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共28页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112995419A(43)申请公布日2021.06.18(21)申请号202110162305.2G06F16/30(2019.01)(22)申请日2021.02.05(71)申请人支付宝（杭州）信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人杨忠敏(74)专利代理机构成都七星天知识产权代理有限公司51253代理人袁春晓(51)Int.Cl.H04M3/493(2006.01)H04M3/527(2006.01)G10L15/22(2006.01)G10L15/26(2006.01)G10L25/87(2013.01)权利要求书3页说明书17页附图7页(54)发明名称一种语音对话的处理方法和系统(57)摘要本说明书实施例提供了一种语音对话的处理方法和系统，包括：获取用户语音，并得到用户语音对应的话语文本；确定话语文本的完整度；判断完整度是否满足预设条件：若满足，则将话语文本作为第一待处理文本送入后续处理流程；否则，等候以便得到第一额外的话语文本，并在等候持续语音等候时长之后，将话语文本作为第一待处理文本送入后续处理流程，或者基于话语文本以及第一额外的话语文本确定第一待处理文本并送入后续处理流程的方法和系统。还包括在播报机器人语音的过程中：检测新的用户语音；当检测到新的用户语音且用户语音状态为用户持续讲话时，获取话术文本中未播报内容中的分词时点，并在分词时点到来时停止播报。CN112995419ACN112995419A权利要求书1/3页1.一种语音对话的处理方法，包括：获取用户语音，并得到所述用户语音对应的话语文本；确定所述话语文本的完整度；其中，通过完整度识别模型处理所述话语文本，以确定所述话语文本的完整度；判断所述完整度是否满足预设条件：若满足，则将所述话语文本作为第一待处理文本送入后续处理流程；否则，等候以便得到第一额外的话语文本，并在所述等候持续语音等候时长之后，将所述话语文本作为第一待处理文本送入后续处理流程，或者基于所述话语文本以及所述第一额外的话语文本确定第一待处理文本并送入后续处理流程。2.如权利要求1所述的方法，所述语音等候时长与所述完整度负相关。3.如权利要求1所述的方法，还包括：若所述话语文本的完整度满足预设条件，则基于所述话语文本和所述用户语音结束后第一时长内的第二额外的话语文本确定第二待处理文本并送入后续处理流程。4.如权利要求3所述的方法，所述基于所述话语文本和所述用户语音结束后第一时长内的第二额外的话语文本确定第二待处理文本，包括：将所述话语文本与所述第二额外的话语文本进行拼接，作为所述第二待处理文本。5.如权利要求3所述的方法，所述基于所述话语文本和所述用户语音结束后第一时长内的第二额外的话语文本确定第二待处理文本，包括：将所述话语文本与所述第二额外的话语文本进行拼接，得到拼接话语文本；确定所述拼接话语文本与所述话语文本的语义相似度；判断所述语义相似度是否大于相似度阈值：若否，则将所述拼接话语文本作为所述第二待处理文本。6.如权利要求3所述的方法，所述话语文本所在的第一待处理文本对应有意图状态标识；所述方法还包括将所述话语文本所在的第一待处理文本对应的意图状态标识赋予所述第二待处理文本。7.如权利要求6所述的方法，所述后续处理流程中的对话机器人基于所述意图状态标识对应的对话意图状态生成话术文本，不同的意图状态标识对应不同的对话意图状态。8.如权利要求7所述的方法，还包括：当所述对话机器人生成话术文本后更新所述意图状态标识，以便下一轮语音对话使用。9.如权利要求1所述的方法，所述后续处理流程包括：通过对话机器人处理待处理文本，并生成话术文本；将所述话术文本转化为机器人语音，并播报。10.如权利要求9所述的方法，在播报所述机器人语音的过程中：检测新的用户语音；当检测到新的用户语音且用户语音状态为用户持续讲话时，获取所述话术文本中未播报内容中的分词时点，并在所述分词时点到来时停止播报。11.如权利要求10所述的方法，所述分词时点为所述话术文本中未播报内容中最近的分词时点。12.如权利要求9所述的方法，所述获取用户语音，并得到所述用户语音对应的话语文本，包括：2CN112995419A权利要求书2/3页检测所述用户语音中静音及其持续时长：若静音的持续时长小于第二时长，则将相应静音前后的用户语音合并进行文本转换；否则基于相应静音将所述用户语音截断后分别进行文本转换；所述后续处理流程还包括：基于所述话术文本调整所述第二时长。13.一种语音对话的处理系统，包括：第一语音获取模块：用于获取用户语音，并得到所述用户语音对应的话语文本；第一对话处理模块：用于确定所述话语文本的完整度；其中

相关资料

一种语音对话的处理方法和系统.pdf

本说明书实施例提供了一种语音对话的处理方法和系统，包括：获取用户语音，并得到用户语音对应的话语文本；确定话语文本的完整度；判断完整度是否满足预设条件：若满足，则将话语文本作为第一待处理文本送入后续处理流程；否则，等候以便得到第一额外的话语文本，并在等候持续语音等候时长之后，将话语文本作为第一待处理文本送入后续处理流程，或者基于话语文本以及第一额外的话语文本确定第一待处理文本并送入后续处理流程的方法和系统。还包括在播报机器人语音的过程中：检测新的用户语音；当检测到新的用户语音且用户语音状态为用户持续讲话时，

2023-05-25

880KB

一种对话处理方法和系统.pdf

本说明书实施例提供了一种对话处理方法和系统，包括：获取来自对话窗口的卡片链接，卡片链接指向与目标对象相关的页面，且具有标记信息以及被显示的图像和/或文本，所述标记信息包括卡片标签以及描述信息；基于所述标记信息，从知识库中获取一个或多个目标知识点；将所述一个或多个目标知识点通过所述对话窗口反馈给用户。

2023-05-25

553KB

对话系统和对话处理方法.pdf

一种用于车辆的对话系统可以包括：输入处理器，其被配置为接收车辆的包括驾驶员和至少一个乘客的乘员之间的对话，检测车辆操作信息，基于乘员之间的对话或车辆操作信息识别至少一个乘客，基于乘员之间的对话来生成估算当车辆到达停留点时车辆中的乘客数量的变化的乘客数量信息，并根据乘客数量信息来获取预话语消息；以及结果处理器，其被配置为根据预话语消息输出所述预话语。

2023-11-14

8.6MB

用于管理语音系统的对话的方法和系统.pdf

本发明涉及用于管理语音系统的对话的方法和系统。方法和系统被提供来用于管理语音系统的语音对话。在一个实施例中，一种方法包括：接收来自语音系统的用户的第一表达；确定来自第一表达的可能结果的第一列表，其中第一列表包括至少两个要素，每个要素表示一种可能结果；分析第一列表的所述至少两个要素来确定要素的歧义；以及基于部分正字法和所述歧义来对用户生成语音提示。

2023-06-11

454KB

语音处理方法、系统和终端.pdf

本发明实施例提供了一种语音处理方法、系统和终端。该方法包括：将语音发送至多个NLP引擎，以使所述多个NLP引擎分别对所述语音进行识别，以获取识别结果；接收来自于所述多个NLP引擎的识别结果；根据来自于所述多个NLP引擎的识别结果，确定一个或多个识别结果并向用户输出所述一个或多个识别结果。本发明实施例的语音处理方法、系统和终端可以使得多个NLP引擎为用户的一段语音进行处理，可以利用到多个厂商的技术，从而可以得到各种侧重不同的搜索结果。

2023-06-11

2.1MB