任务型对话系统的对话状态跟踪、训练方法及系统-豆柴文库

任务型对话系统的对话状态跟踪、训练方法及系统.pdf

2023-12-03

10金币

517KB

16页

猫巷****晓容

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共16页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111611347A(43)申请公布日2020.09.01(21)申请号202010443243.8(22)申请日2020.05.22(71)申请人上海乐言信息科技有限公司地址200050上海市长宁区长宁路1033号联通大厦16楼/18楼/19楼申请人南京大学(72)发明人沈李斌戴新宇陈陌信欧阳亚文赵迎功吴海华(74)专利代理机构上海专利商标事务所有限公司31100代理人施浩(51)Int.Cl.G06F16/33(2019.01)G06F16/332(2019.01)G06F40/284(2020.01)权利要求书3页说明书8页附图4页(54)发明名称任务型对话系统的对话状态跟踪、训练方法及系统(57)摘要本发明公开了一种任务型对话系统的对话状态跟踪、训练方法及系统，提高了多领域复杂场景中的对话状态跟踪准确率。其技术方案为：对话历史进行预处理，获得以词为单位的对话历史文本的向量化表示；对向量化的对话历史文本，使用双向长短期记忆网络作为编码器进行编码；初始化解码器，解码出目标槽位信息；关注对话历史中的目标槽位信息，通过注意力机制计算对话历史中每个词对于目标槽位的重要程度；判断输入的对话历史中是否提及目标槽位，若提及目标槽位则进行下一步的处理，否则方法结束；从对话历史的向量化表示、对话历史的原始输入以及历史对话状态中分别寻找目标槽位取值，最后据此得到目标槽位的最终取值。CN111611347ACN111611347A权利要求书1/3页1.一种任务型对话系统的对话状态跟踪方法，其特征在于，方法包括：步骤1：对话历史进行预处理，获得以词为单位的对话历史文本的向量化表示；步骤2：对向量化的对话历史文本进行编码；步骤3：初始化解码器，解码出目标槽位信息；步骤4：关注对话历史中的目标槽位信息，通过注意力机制计算对话历史中每个词对于目标槽位的重要程度；步骤5：判断输入的对话历史中是否提及目标槽位，若提及目标槽位则进行下一步的处理，否则方法结束；步骤6：从对话历史的向量化表示、对话历史的原始输入以及历史对话状态中分别寻找目标槽位取值，分别记为Pgen、Pwc、Pvc；步骤7：根据步骤6通过三种途径寻找到的目标槽位取值Pgen、Pwc、Pvc，得到目标槽位的最终取值。2.根据权利要求1所述的任务型对话系统的对话状态跟踪方法，其特征在于，步骤1进一步包括：首先对对话历史文本进行分词处理，然后使用预训练的词嵌入以便将分词处理后的每个词映射为对应的词向量，得到一连串以词为单位的对话历史文本的向量化表示。3.根据权利要求1所述的任务型对话系统的对话状态跟踪方法，其特征在于，步骤2中是使用双向长短期记忆网络作为编码器或者使用Transformer模型来编码文本输入。4.根据权利要求1所述的任务型对话系统的对话状态跟踪方法，其特征在于，步骤3中的解码器采用双向长短期记忆网络的结构，使用编码器的最后时刻的隐层状态对解码器进行初始化；步骤3中的解码出目标槽位信息进一步包括解码器接收目标槽位名称作为初始输入，与解码器内部状态进行交互，解码出目标槽位的信息。5.根据权利要求1所述的任务型对话系统的对话状态跟踪方法，其特征在于，步骤5中对是否提及目标槽位的判断进一步包括：将对话历史的向量化表示输入到多层感知机后判断是否提及目标槽位。6.根据权利要求1所述的任务型对话系统的对话状态跟踪方法，其特征在于，步骤6进一步包括以下并行处理的三个步骤：将对话历史的向量化表示输入到多层感知机中，映射生成预定义输出词表的概率分布Pgen；从对话历史的原始输入中拷贝目标槽位取值，采用步骤3中注意力机制计算得到的权重作为拷贝目标槽位取值的输出概率分布Pwc；使用注意力机制建模目标槽位与历史对话状态中槽位的关联，获取关联槽位取值的输出概率分布Pvc，其中历史对话状态为上一时刻的对话状态预测结果。7.根据权利要求1所述的任务型对话系统的对话状态跟踪方法，其特征在于，步骤7进一步包括：首先使用多层感知机作为门控，分别计算出映射生成的概率并记为g1、和关联概率并记为g2；采用分层融合的方法，先使用生成概率g1融合生成信息和拷贝信息，再使用关联概率g2融合关联槽位的信息，融合后的目标槽位取值概率分布为g2*Pvc+(1-g2)*[g1*Pgen+(1-g1)*Pwc]；2CN111611347A权利要求书2/3页最后通过argmax操作得到最大输出概率对应的下标，从词表中取出下标对应的词作为输出。8.一种任务型对话系统的对话状态跟踪系统，其特征在于，系统包括：对话历史预处理模块，对话历史进行预处理，获得以词为单位的对话历史文本的向量化表示；编码模块，对向量化的对话历史文本进行编码；解码模块，初始化解码器，解码出目标槽位

相关资料

任务型对话系统的对话状态跟踪、训练方法及系统.pdf

本发明公开了一种任务型对话系统的对话状态跟踪、训练方法及系统，提高了多领域复杂场景中的对话状态跟踪准确率。其技术方案为：对话历史进行预处理，获得以词为单位的对话历史文本的向量化表示；对向量化的对话历史文本，使用双向长短期记忆网络作为编码器进行编码；初始化解码器，解码出目标槽位信息；关注对话历史中的目标槽位信息，通过注意力机制计算对话历史中每个词对于目标槽位的重要程度；判断输入的对话历史中是否提及目标槽位，若提及目标槽位则进行下一步的处理，否则方法结束；从对话历史的向量化表示、对话历史的原始输入以及历史对话

2023-12-03

517KB

对话状态跟踪器的训练方法及系统.pdf

本发明实施例提供一种对话状态跟踪器的训练方法。该方法包括：通过已标注对话集(L)预训练对话状态跟踪器，以确定未标注对话集(U)中各未标注对话的预测概率和对话轮数；来确定各未标注对话的时间代价参数和/或稳定性参数和/或多元化参数；根据所述参数，确定对应各未标注对话的优先权；按照优先权从未标注对话集(U)中选取部分的未标注对话进行标注，添加至已标注对话集(L)；通过添加后的已标注对话集(L)训练对话状态跟踪器。本发明实施例还提供一种对话状态跟踪器的训练系统。本发明实施例的对话状态跟踪器的训练方法根据考虑不同的

2023-08-30

832KB

对话状态跟踪方法、装置及对话状态跟踪模型训练方法.pdf

本公开提供了一种对话状态跟踪方法、装置，涉及人工智能领域。该方法包括：获取历史对话和当前轮次对话，将历史对话、当前轮次对话、当前轮次对话中的槽和与当前轮次对话中的槽对应的值集合输入至对话状态跟踪模型；通过对话状态跟踪模型对历史对话、当前轮次对话、当前轮次对话中的槽和与当前轮次对话中的槽对应的值集合进行特征提取，以获取与当前轮次对话对应的对话状态；对话状态跟踪模型是基于自适应优化损失函数训练得到的，自适应优化损失函数包括槽优化系数和样本优化系数，并且槽优化系数是根据每个槽在验证数据集上的准确率确定的，样本优

2023-08-26

1.2MB

在面向目标的对话系统中用于跟踪对话状态的方法和设备.pdf

本实施方式提供了用于跟踪对话状态的方法和设备，其使得能够容易地在面向目标的对话系统中通过以下操作将服务扩展至对话系统中的多域场景：通过在跟踪对话状态时基于使用距离度量的非参数方法以及话语与对应于域和空档类型的上下文语义向量之间的注意力机制进行训练来跟踪对话状态。

2023-07-24

1.1MB

任务型对话系统中对话管理方法研究.docx

任务型对话系统中对话管理方法研究标题：任务型对话系统中对话管理方法研究Abstract:任务型对话系统是一种能够与用户进行复杂语义级别的对话，并完成特定任务的智能系统。对话管理作为任务型对话系统中的关键组成部分，其目标是理解用户的意图、生成合理的回复、有效地推动对话流程，并最终完成特定任务。本文将探讨任务型对话系统中对话管理的不同方法和技术，并评估其优势和局限性。1.引言任务型对话系统的出现，使得用户可以通过对话和系统进行交互，从而实现任务的完成。这种系统在多个领域都得到了广泛的应用，例如智能助理、客户服

2024-10-16

11KB