预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114327084A(43)申请公布日2022.04.12(21)申请号202011053566.2G06N3/08(2006.01)(22)申请日2020.09.29(71)申请人北京搜狗科技发展有限公司地址100084北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间(72)发明人王丹崔欣(74)专利代理机构北京润泽恒知识产权代理有限公司11319代理人苏培华(51)Int.Cl.G06F3/023(2006.01)G06F16/31(2019.01)G06F16/33(2019.01)G06F40/284(2020.01)G06N3/04(2006.01)权利要求书2页说明书9页附图3页(54)发明名称一种词条召回方法、装置和用于召回词条的装置(57)摘要本申请实施例公开了一种词条召回方法、装置和用于召回词条的装置。该方法的实施例包括:获取目标用户的输入词序列;基于输入词序列和预先训练的深度树匹配模型,从候选词词表中召回目标词条;将目标词条发送至目标用户的客户端。该实施方式可召回符合用户输入习惯的个性化词条,提高了用户的输入效率。CN114327084ACN114327084A权利要求书1/2页1.一种词条召回方法,其特征在于,所述方法包括:获取候选词词表和目标用户的输入词序列;基于所述输入词序列和预先训练的深度树匹配模型,从所述候选词词表中召回目标词条;将所述目标词条发送至所述目标用户的客户端。2.根据权利要求1所述的方法,其特征在于,所述深度树匹配模型包括树模型和深度神经网络,所述树模型的叶子节点与所述候选词词表中的词条一一对应。3.根据权利要求2所述的方法,其特征在于,所述基于所述输入词序列和预先训练的深度树匹配模型,从预先获取的候选词词表中召回目标词条,包括:基于所述输入词序列和所述深度神经网络,从所述树模型中选取预设数量的叶子节点;将所选取的叶子节点对应的词条作为目标词条,召回所述目标词条。4.根据权利要求3所述的方法,其特征在于,所述从所述树模型中选取预设数量的叶子节点,包括:将所述树模型的根节点作为第一层目标节点,按照从根节点到叶子节点的顺序,依次从每层目标节点的子节点中选取预设数量的节点作为下一层的目标节点,以得到所述预设数量的叶子节点。5.根据权利要求4所述的方法,其特征在于,所述依次从每层目标节点的子节点中选取预设数量的节点作为下一层的目标节点,包括:对于所述树模型的每一层目标节点,执行如下步骤:将该层目标节点的子节点进行聚类,得到多个簇;从所述多个簇中分别选择代表节点,并确定各代表节点的得分;将每个代表节点的得分作为该代表节点所属簇中的其他节点的得分,按照得分从该层目标节点的子节点中选取预设数量的节点作为下一层的目标节点。6.根据权利要求5所述的方法,其特征在于,所述从所述多个簇中分别选择代表节点,并确定各代表节点的得分,包括:对于所述多个簇中的每一簇,确定该簇中的每一节点与该簇中的其他节点的距离之和,将所述距离之和的最小值对应的节点作为该簇的代表节点。7.根据权利要求5所述的方法,其特征在于,所述从所述多个簇中分别选择代表节点,并确定各代表节点的得分,包括:对于所述多个簇中的每一簇,确定该簇的聚类中心以及该簇中的节点与所述聚类中心的距离,将所述距离的最小值对应的节点作为该簇的代表节点。8.一种词条召回装置,其特征在于,所述装置包括:获取单元,被配置成获取目标用户的输入词序列;召回单元,被配置成基于所述输入词序列和预先训练的深度树匹配模型,从所述候选词词表中召回目标词条;发送单元,被配置成将所述目标词条发送至所述目标用户的客户端。9.一种用于召回词条的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器2CN114327084A权利要求书2/2页执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取目标用户的输入词序列;基于所述输入词序列和预先训练的深度树匹配模型,从所述候选词词表中召回目标词条;将所述目标词条发送至所述目标用户的客户端。10.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一所述的方法。3CN114327084A说明书1/9页一种词条召回方法、装置和用于召回词条的装置技术领域[0001]本申请实施例涉及计算机技术领域,具体涉及一种词条召回方法、装置和用于召回词条的装置。背景技术[0002]输入法客户端通常配置有系统词库,该词库中通常包含全量的高频词以及一些权威词、热点词等。在用户输入过程中,可从系统词库中选取若干词条作为候选项推荐给用户。[0003]然而,随着越