预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111221945A(43)申请公布日2020.06.02(21)申请号202010329631.3(22)申请日2020.04.24(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人蒋亮温祖杰张家兴(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人孙欣欣周良玉(51)Int.Cl.G06F16/33(2019.01)权利要求书2页说明书7页附图2页(54)发明名称基于用户问句生成标准问题的方法和装置(57)摘要本说明书实施例提供一种基于用户问句生成标准问题的方法和装置,方法包括:获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;提取所述第一多轮对话中第一数目轮的用户问句;对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。能够提高标准问题的生产效率,相应提升标准问题的覆盖率。CN111221945ACN111221945A权利要求书1/2页1.一种基于用户问句生成标准问题的方法,所述方法包括:获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第一数目轮的用户问句和客服答案;提取所述第一多轮对话中第一数目轮的用户问句;对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。2.如权利要求1所述的方法,其中,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,包括:判断所述第一数目是否小于或等于预设数目;若所述第一数目小于或等于所述预设数目,则对所述第一数目轮的用户问句进行拼接处理,得到所述第一输入文本。3.如权利要求2所述的方法,其中,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,还包括:若所述第一数目大于所述预设数目,则将所述第一数目轮的用户问句按照顺序分为多组用户问句,每组用户问句包含的用户问句的数目不大于所述预设数目,且相邻的两组用户问句具有交集;对所述各组用户问句分别进行拼接处理,得到各组用户问句分别对应的所述第一输入文本。4.如权利要求1所述的方法,其中,所述对所述第一数目轮的用户问句至少进行拼接处理,得到第一输入文本,包括:识别所述第一数目轮的用户问句中的闲聊语句;删除所述第一数目轮的用户问句中的闲聊语句,得到第二数目轮的用户问句;对所述第二数目轮的用户问句进行拼接处理,得到第一输入文本。5.如权利要求1所述的方法,其中,所述文本生成模型基于训练样本预先训练;所述训练样本通过如下方式获取:获取用户与机器人客服的第二多轮对话;从所述第二多轮对话中提取用户问句和匹配成功的标准问题,以作为训练样本。6.如权利要求1所述的方法,其中,所述获取目标用户与人工客服的第一多轮对话之前,所述方法还包括:确定在所述第一多轮对话之前,所述目标用户与机器人客服进行了第三多轮对话,所述第三多轮对话中未得到匹配成功的标准问题。7.如权利要求1所述的方法,其中,所述文本生成模型包括编码器和解码器;所述将所述第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题,包括:将所述第一输入文本输入所述编码器,得到语义向量;将所述语义向量输入所述解码器,得到所述第一多轮对话对应的标准问题。8.一种基于用户问句生成标准问题的装置,所述装置包括:获取单元,用于获取目标用户与人工客服的第一多轮对话,所述第一多轮对话包括第2CN111221945A权利要求书2/2页一数目轮的用户问句和客服答案;提取单元,用于提取所述获取单元获取的第一多轮对话中第一数目轮的用户问句;拼接单元,用于对所述提取单元提取的第一数目轮的用户问句至少进行拼接处理,得到第一输入文本;生成单元,用于将所述拼接单元得到的第一输入文本输入预先训练的文本生成模型,得到所述第一多轮对话对应的标准问题。9.如权利要求8所述的装置,其中,所述拼接单元包括:判断子单元,用于判断所述第一数目是否小于或等于预设数目;第一拼接子单元,用于若所述判断子单元判断出所述第一数目小于或等于所述预设数目,则对所述第一数目轮的用户问句进行拼接处理,得到所述第一输入文本。10.如权利要求9所述的装置,其中,所述拼接单元还包括:分组子单元,用于若所述判断子单元判断出所述第一数目大于所述预设数目,则将所述第一数目轮的用户问句按照顺序分为多组用户问句,每组用户问句包含的用户问句的数目不大于所述预设数目,且相邻的两组用户问句具有交集;第二拼接子单元,用于对所述分组子单元得到的各组用