对话状态跟踪器的训练方法及系统-豆柴文库

对话状态跟踪器的训练方法及系统.pdf

2023-08-30

10金币

832KB

16页

纪阳****公主

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共16页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108847220A(43)申请公布日2018.11.20(21)申请号201810538670.7(22)申请日2018.05.30(71)申请人苏州思必驰信息科技有限公司地址215123江苏省苏州市苏州工业园区新平街388号腾飞创新园14栋申请人上海交通大学(72)发明人俞凯谢凯歌(74)专利代理机构北京商专永信知识产权代理事务所(普通合伙)11400代理人方挺黄谦(51)Int.Cl.G10L15/06(2013.01)G10L15/22(2006.01)权利要求书2页说明书10页附图3页(54)发明名称对话状态跟踪器的训练方法及系统(57)摘要本发明实施例提供一种对话状态跟踪器的训练方法。该方法包括：通过已标注对话集(L)预训练对话状态跟踪器，以确定未标注对话集(U)中各未标注对话的预测概率和对话轮数；来确定各未标注对话的时间代价参数和/或稳定性参数和/或多元化参数；根据所述参数，确定对应各未标注对话的优先权；按照优先权从未标注对话集(U)中选取部分的未标注对话进行标注，添加至已标注对话集(L)；通过添加后的已标注对话集(L)训练对话状态跟踪器。本发明实施例还提供一种对话状态跟踪器的训练系统。本发明实施例的对话状态跟踪器的训练方法根据考虑不同的未标注对话具有不同的时间代价，增加了待标注对话的选择方式而提升对话状态跟踪器的训练效果。CN108847220ACN108847220A权利要求书1/2页1.一种对话状态跟踪器的训练方法，包括：通过已标注对话集(L)预训练对话状态跟踪器，以确定未标注对话集(U)中各未标注对话的预测概率和对话轮数；根据各未标注对话的对话轮数，确定各未标注对话的时间代价参数；和/或根据各未标注对话的预测概率和对话轮数，确定各未标注对话的熵作为稳定性参数；和/或提取所述已标注对话集(L)中各已标注对话的第一特征向量集合(VL)，并对所述第一特征向量集合(VL)均值聚类以确定至少一个聚点，提取所述未标注对话集中各未标注对话的第二特征向量集合(VU)，并根据所述第二特征向量集合(VU)中各特征向量与所述至少一个聚点的最大距离，确定各未标注对话的多元化参数；根据所确定的所述多元化参数和/或所述稳定性参数和/或所述时间代价参数，确定对应于各未标注对话的优先权；按照优先权从高到低从所述未标注对话集(U)中选取部分数量的未标注对话进行标注，添加至所述已标注对话集(L)；通过添加后的所述已标注对话集(L)训练对话状态跟踪器。2.根据权利要求1所述的方法，其中，当仅根据所述时间代价参数确定对应于各未标注对话的优先权时，所述时间代价参数为对应的未标注对话的对话轮数。3.根据权利要求1所述的方法，其中，当根据所述多元化参数和所述稳定性参数中的至少一种参数连同所述时间代价参数确定对应于各未标注对话的优先权时，所述各未标注对话的时间代价参数为各自的对话轮数ti与所有未标注对话的对话轮数中的最大值tmax的比值。4.根据权利要求1所述的方法，其中，所述方法包括：在每轮训练后，检测已标注对话集L中的对话数量；直到检测到对话数量超过预设阈值时，停止下一轮训练。5.根据权利要求1所述的方法，其中，所述根据各未标注对话的预测概率和对话轮数，确定各未标注对话的熵作为稳定性参数包括：将各未标注对话对应的每一对话轮数的预测概率与所述预测概率对数乘积总和的均值的相反数作为各未标注对话的熵，将所述各未标注对话的熵作为稳定性参数。6.一种对话状态跟踪器的训练系统，包括：预训练程序模块，用于通过已标注对话集(L)预训练对话状态跟踪器，以确定未标注对话集(U)中各未标注对话的预测概率和对话轮数；时间代价参数确定程序模块，用于根据各未标注对话的对话轮数，确定各未标注对话的时间代价参数；和/或稳定性参数确定程序模块，用于根据各未标注对话的预测概率和对话轮数，确定各未标注对话的熵作为稳定性参数；和/或多元化参数确定程序模块，用于提取所述已标注对话集(L)中各已标注对话的第一特征向量集合(VL)，并对所述第一特征向量集合(VL)均值聚类以确定至少一个聚点，提取所述未标注对话集中各未标注对话的第二特征向量集合(VU)，并根据所述第二特征向量集合(VU)中各特征向量与所述至少一个聚点的最大距离，确定各未标注对话的多元化参数；2CN108847220A权利要求书2/2页优先权确定程序模块，用于根据所确定的所述多元化参数和/或所述稳定性参数和/或所述时间代价参数，确定对应于各未标注对话的优先权；对话标注程序模块，用于至少按照优先权从高到低从所述未标注对话集(U)中选取部分数量的未标注对话进行标注，添加至所述已标注对话集(L)；对话状态跟踪器训练程序模块，用于通过添加后的所述已标注对话集(L

相关资料

对话状态跟踪器的训练方法及系统.pdf

本发明实施例提供一种对话状态跟踪器的训练方法。该方法包括：通过已标注对话集(L)预训练对话状态跟踪器，以确定未标注对话集(U)中各未标注对话的预测概率和对话轮数；来确定各未标注对话的时间代价参数和/或稳定性参数和/或多元化参数；根据所述参数，确定对应各未标注对话的优先权；按照优先权从未标注对话集(U)中选取部分的未标注对话进行标注，添加至已标注对话集(L)；通过添加后的已标注对话集(L)训练对话状态跟踪器。本发明实施例还提供一种对话状态跟踪器的训练系统。本发明实施例的对话状态跟踪器的训练方法根据考虑不同的

2023-08-30

832KB

任务型对话系统的对话状态跟踪、训练方法及系统.pdf

本发明公开了一种任务型对话系统的对话状态跟踪、训练方法及系统，提高了多领域复杂场景中的对话状态跟踪准确率。其技术方案为：对话历史进行预处理，获得以词为单位的对话历史文本的向量化表示；对向量化的对话历史文本，使用双向长短期记忆网络作为编码器进行编码；初始化解码器，解码出目标槽位信息；关注对话历史中的目标槽位信息，通过注意力机制计算对话历史中每个词对于目标槽位的重要程度；判断输入的对话历史中是否提及目标槽位，若提及目标槽位则进行下一步的处理，否则方法结束；从对话历史的向量化表示、对话历史的原始输入以及历史对话

2023-12-03

517KB

对话状态跟踪方法、装置及对话状态跟踪模型训练方法.pdf

本公开提供了一种对话状态跟踪方法、装置，涉及人工智能领域。该方法包括：获取历史对话和当前轮次对话，将历史对话、当前轮次对话、当前轮次对话中的槽和与当前轮次对话中的槽对应的值集合输入至对话状态跟踪模型；通过对话状态跟踪模型对历史对话、当前轮次对话、当前轮次对话中的槽和与当前轮次对话中的槽对应的值集合进行特征提取，以获取与当前轮次对话对应的对话状态；对话状态跟踪模型是基于自适应优化损失函数训练得到的，自适应优化损失函数包括槽优化系数和样本优化系数，并且槽优化系数是根据每个槽在验证数据集上的准确率确定的，样本优

2023-08-26

1.2MB

在面向目标的对话系统中用于跟踪对话状态的方法和设备.pdf

本实施方式提供了用于跟踪对话状态的方法和设备，其使得能够容易地在面向目标的对话系统中通过以下操作将服务扩展至对话系统中的多域场景：通过在跟踪对话状态时基于使用距离度量的非参数方法以及话语与对应于域和空档类型的上下文语义向量之间的注意力机制进行训练来跟踪对话状态。

2023-07-24

1.1MB

基于用户交互的多轮对话在线训练方法及系统.pdf

本发明公开了一种基于用户交互的多轮对话在线训练方法及系统，其中，该方法包括：获取当前对话轮次，并判断对话轮次是否大于预设阈值；若对话轮次大于预设阈值，则获取当前动作；若当前动作为接收操作动作时，则通过自然语言理解模块对当前动作进行意图和实体识别；若意图和实体的识别结果任一存在错误，则接收用户定义正确的意图和实体；根据用户定义正确的意图和实体对自然语言理解模块进行实时在线训练。该方法通过与用户在线交互，实时对模块进行训练，解决任务型多轮对话系统中文对话数据集匮乏且质量不高的问题，可适用于不同的对话场景。

2023-08-29

935KB