针对多轮对话生成回复语句的方法和装置-豆柴文库

针对多轮对话生成回复语句的方法和装置.pdf

2023-05-25

10金币

951KB

17页

英瑞****写意

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共17页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111400481A(43)申请公布日2020.07.10(21)申请号202010410108.3(22)申请日2020.05.15(71)申请人支付宝（杭州）信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人林谢雄简葳玙何建杉王太峰(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人孙欣欣周良玉(51)Int.Cl.G06F16/332(2019.01)权利要求书3页说明书9页附图4页(54)发明名称针对多轮对话生成回复语句的方法和装置(57)摘要本说明书实施例提供一种针对多轮对话生成回复语句的方法和装置，方法包括：获取历史上下文；对历史上下文基于注意力机制进行编码，得到历史上下文对应的上下文向量，以及历史上下文对应的第一分词序列的编码注意力分布；对候选知识集合中的各候选知识基于注意力机制进行编码，得到候选知识集合对应的知识融合向量，以及候选知识集合对应的第二分词序列的知识注意力分布；针对回复语句进行逐词预测，其中每次预测包括：对于扩充词表中每个候选词，得到将该候选词作为下一个词的预测概率；扩充词表包括，用于生成候选词的初始词表，第一分词序列中各分词，以及第二分词序列中各分词。在针对多轮对话生成回复语句时能够处理词汇不足单词。CN111400481ACN111400481A权利要求书1/3页1.一种针对多轮对话生成回复语句的方法，所述方法包括：获取多轮对话中包含当前用户问句的历史上下文；对所述历史上下文基于注意力机制进行编码，得到所述历史上下文对应的上下文向量，以及所述历史上下文对应的第一分词序列的编码注意力分布；对候选知识集合中的各候选知识基于注意力机制进行编码，得到所述候选知识集合对应的知识融合向量，以及所述候选知识集合对应的第二分词序列的知识注意力分布；针对回复语句进行逐词预测，其中每次预测包括：通过指针生成网络，分别生成当前的第一指针和第二指针，第一指针指示根据历史上下文生成下一个词的概率，第二指针指示根据候选知识集合生成下一个词的概率；对于扩充词表中每个候选词，至少根据所述上下文向量、所述知识融合向量预测生成该候选词的第一概率；根据第一指针和编码注意力分布，确定从历史上下文中复制该候选词的第二概率，根据第二指针和知识注意力分布，确定从候选知识集合中复制该候选词的第三概率，并根据所述第一概率，第二概率和第三概率，得到将该候选词作为下一个词的预测概率；其中所述扩充词表包括，用于生成候选词的初始词表，第一分词序列中各分词，以及第二分词序列中各分词；根据扩充词表中各个词的预测概率，预测下一个词。2.如权利要求1所述的方法，其中，所述历史上下文还包括至少一轮的历史用户问句和历史回复语句。3.如权利要求1所述的方法，其中，所述对候选知识集合中的各候选知识基于注意力机制进行编码之前，所述方法还包括：提取所述历史上下文中的实体词或关键词；根据所述实体词或关键词，确定与所述历史上下文相关的所述候选知识集合。4.如权利要求1所述的方法，其中，所述候选知识包括：句子形式的候选知识或三元组形式的候选知识；所述三元组形式的候选知识包括能够扩充为句子的三个实体词或关键词。5.如权利要求1所述的方法，其中，所述对候选知识集合中的各候选知识基于注意力机制进行编码，包括：对候选知识集合中的各候选知识分别基于注意力机制进行编码，得到所述各候选知识分别对应的单条知识向量，以及各候选知识分别对应的分词序列的注意力分布；针对各单条知识向量，基于注意力机制进行编码，得到所述候选知识集合对应的知识融合向量；以及根据各候选知识分别对应的分词序列的注意力分布，进行综合处理，得到所述候选知识集合对应的第二分词序列的知识注意力分布。6.如权利要求1所述的方法，其中，所述通过指针生成网络，分别生成当前的第一指针和第二指针，包括：通过指针生成网络，根据所述上下文向量、前一个词的解码状态、以及前一个词对应的词向量和所述上下文向量的组合向量，生成当前的第一指针；通过指针生成网络，根据所述知识融合向量、前一个词的解码状态、以及前一个词对应的词向量和所述知识融合向量的组合向量，生成当前的第二指针。7.如权利要求1所述的方法，其中，所述根据所述第一概率，第二概率和第三概率，得到2CN111400481A权利要求书2/3页将该候选词作为下一个词的预测概率，包括：当该候选词存在于所述初始词表中，且不存在于所述第一分词序列中，且不存在于所述第二分词序列中，根据所述第一概率，得到将该候选词作为下一个词的预测概率。8.如权利要求1所述的方法，其中，所述根据所述第一概率，第二概率和第三概率，得到将该候选词作为下一个词的预测概率，包括：当该候选词存

相关资料

针对多轮对话生成回复语句的方法和装置.pdf

本说明书实施例提供一种针对多轮对话生成回复语句的方法和装置，方法包括：获取历史上下文；对历史上下文基于注意力机制进行编码，得到历史上下文对应的上下文向量，以及历史上下文对应的第一分词序列的编码注意力分布；对候选知识集合中的各候选知识基于注意力机制进行编码，得到候选知识集合对应的知识融合向量，以及候选知识集合对应的第二分词序列的知识注意力分布；针对回复语句进行逐词预测，其中每次预测包括：对于扩充词表中每个候选词，得到将该候选词作为下一个词的预测概率；扩充词表包括，用于生成候选词的初始词表，第一分词序列中各分

2023-05-25

951KB

针对多轮对话的分类方法和装置.pdf

本说明书实施例提供一种针对多轮对话的分类方法和装置。方法包括：获取目标用户与机器人之间进行的多轮对话；将所述多轮对话中各轮对话的用户问句分别输入第一特征提取模型，通过所述第一特征提取模型分别输出所述各轮对话分别对应的第一特征向量；根据所述各轮对话的顺序，对所述各轮对话之前的对话对应的第一特征向量采用自注意力机制，生成所述各轮对话分别对应的第二特征向量；将所述目标用户的预设历史行为的行为特征输入第二特征提取模型，通过所述第二特征提取模型输出第三特征向量；至少根据所述各轮对话分别对应的第二特征向量和所述第三特

2023-08-28

694KB

针对多轮对话的问题识别方法和装置.pdf

本说明书实施例提供一种针对多轮对话的问题识别方法和装置，方法基于预先建立的知识图谱进行问题识别，知识图谱包括多个类型的节点，节点之间通过对应类型的连接边进行连接，方法包括：获取当前多轮对话的当前用户文本；通过要素预测模型输出当前用户文本中包括的第一业务要素和/或第一诉求要素；确定知识图谱中对应于当前用户文本的第一文本节点，对应于第一业务要素的第一业务节点和/或对应于第一诉求要素的第一诉求节点；在知识图谱中，以第一文本节点作为初始的当前节点，搜索下一跳节点，直到搜索到标准问句节点，返回对应的标准问句，作为当

2023-05-25

894KB

针对多轮对话的用户意图识别方法和装置.pdf

本说明书实施例提供一种针对多轮对话的用户意图识别方法和装置，基于预先建立的知识图谱进行用户意图识别，该知识图谱将各知识点要素与各标准问句关联起来，方法包括：获取当前多轮对话的至少一轮的用户文本；对至少一轮的用户文本进行编码，得到上下文嵌入向量；在知识图谱中，根据上下文嵌入向量，从根节点开始迭代搜索下一跳节点；在预定次数的迭代之后，选取目标节点；确定所述目标节点对应的要素或标准问句为用户意图识别结果。能够保证稳定的识别效果。

2023-05-25

793KB

一种对话回复生成方法及一种对话回复生成模型.pdf

本发明涉及一种对话回复生成方法，其包括步骤：S11：根据外部知识构建知识图谱；S12：对知识图谱进行编码获得保留时间维度特征的知识表征向量；S13：对对话历史进行编码获得对话历史隐藏状态向量；S21：根据对话历史隐藏状态向量和上一时刻的生成词解码得到当前时刻的对话回复隐藏状态向量；S22：根据该对话回复隐藏状态向量计算当前时刻的词表生成概率；S31：计算该对话回复隐藏状态向量对知识表征向量的注意力权重；S32：根据该注意力权重计算当前时刻的知识选择概率；S40：根据知识表征向量、该注意力权重和该对话回复隐

2023-06-28

954KB