预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113918830A(43)申请公布日2022.01.11(21)申请号202111204629.4(22)申请日2021.10.15(71)申请人百度在线网络技术(北京)有限公司地址100085北京市海淀区上地十街10号百度大厦三层申请人上海小度技术有限公司(72)发明人陆永帅(74)专利代理机构北京银龙知识产权代理有限公司11243代理人张圣孝(51)Int.Cl.G06F16/9536(2019.01)G06F16/33(2019.01)G06Q50/00(2012.01)G06F40/30(2020.01)权利要求书2页说明书13页附图4页(54)发明名称对话内容的处理方法、装置和电子设备(57)摘要本公开提供了一种对话内容的处理方法、装置和电子设备,涉及数据处理领域,尤其涉及社交产品技术领域。具体实现方案为:所述对话内容的处理方法,包括:获取第一用户发送的初始对话内容,所述初始对话内容为所述第一用户向第二用户待发送的初始对话内容;基于所述初始对话内容在预设数据库中进行查询,得到目标对话内容,其中,所述预设数据库包括多条候选对话内容,所述目标对话内容为所述预设数据库中,与所述初始对话内容的语义匹配的所述候选对话内容;以所述第一用户为发送方,向所述第二用户发送所述目标对话内容。本公开可以避免用户在基于社交产品进行对话的过程中出现不文明用语的问题。CN113918830ACN113918830A权利要求书1/2页1.一种对话内容的处理方法,包括:获取第一用户发送的初始对话内容,所述初始对话内容为所述第一用户向第二用户待发送的初始对话内容;基于所述初始对话内容在预设数据库中进行查询,得到目标对话内容,其中,所述预设数据库包括多条候选对话内容,所述目标对话内容为所述预设数据库中,与所述初始对话内容的语义匹配的所述候选对话内容;以所述第一用户为发送方,向所述第二用户发送所述目标对话内容。2.根据权利要求1所述的方法,其中,所述基于所述初始对话内容在预设数据库中进行查询,得到目标对话内容,包括:将所述初始对话内容与所述预设数据库中的每条所述候选对话内容进行文字匹配;在基于所述文字匹配,匹配到第一对话内容的情况下,将所述第一对话内容确定为所述目标对话内容,其中,所述初始对话内容包括所述第一对话内容中的全部文字。3.根据权利要求2所述的方法,其中,所述将所述初始对话内容与所述预设数据库中的每条所述候选对话内容进行文字匹配之后,所述方法还包括:在基于所述文字匹配,未匹配到所述第一对话内容的情况下,获取所述初始对话内容的第一拼音文本;基于第一拼音文本在所述预设数据库中进行拼音匹配,得到所述目标对话内容。4.根据权利要求3所述的方法,其中,所述基于第一拼音文本在所述预设数据库中进行拼音匹配,得到所述目标对话内容,包括:获取所述预设数据库中,每条所述候选对话内容的第二拼音文本,得到与所述多条候选对话内容一一对应的多条第二拼音文本;分别计算所述第一拼音文本与所述多条第二拼音文本中每条所述第二拼音文本之间的相似度,其中,所述第一拼音文本与目标拼音文本之间的相似度为:目标字段的文本长度与所述目标拼音文本的文本长度之间的比值,所述目标字段为所述第一拼音文本与所述目标拼音文本之间的公共字段,所述目标拼音文本为所述多条第二拼音文本中的任意第二拼音文本;在所述预设数据库中包括第二对话内容的情况下,将所述第二对话内容确定为所述目标对话内容,所述第二对话内容为:所述多条第二拼音文本中,与所述第一拼音文本之间的相似度大于第一阈值的第二拼音文本对应的候选对话内容。5.根据权利要求4所述的方法,其中,所述分别计算所述第一拼音文本与所述多条第二拼音文本中每条所述第二拼音文本之间的相似度之后,所述方法还包括:在所述预设数据库中不包括所述第二对话内容的情况下,获取所述初始对话内容的第一文本向量;基于所述第一文本向量在所述预设数据库中进行向量匹配,得到所述目标对话内容。6.根据权利要求5所述的方法,其中,所述基于所述第一文本向量在所述预设数据库中进行向量匹配,得到所述目标对话内容,包括:获取所述预设数据库中,每条所述候选对话内容的第二文本向量,得到与所述多条候选对话内容一一对应的多条第二文本向量;分别计算所述第一文本向量与所述多条第二文本向量中每条所述第二文本向量之间2CN113918830A权利要求书2/2页的余弦相似度;将目标文本向量对应的候选对话内容确定为所述目标对话内容,其中,所述目标文本向量为所述多条第二文本向量中,与所述第一文本向量之间的余弦相似度最大的第二文本向量。7.根据权利要求1至6中任意一项所述的方法,其中,所述多条候选对话内容包括第一候选对话内容,所述第一候选对话内容包括文本