预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共33页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114168843A(43)申请公布日2022.03.11(21)申请号202111306577.1G06F3/04847(2022.01)(22)申请日2021.11.05G06Q30/06(2012.01)(71)申请人阿里巴巴(中国)有限公司地址310052浙江省杭州市滨江区长河街道网商路699号4号楼5楼508室(72)发明人刘森罗昭慧金林波(74)专利代理机构北京太合九思知识产权代理有限公司11610代理人刘戈张爱(51)Int.Cl.G06F16/9535(2019.01)G06F16/9538(2019.01)G06F40/216(2020.01)G06F9/451(2018.01)G06F3/04842(2022.01)权利要求书3页说明书22页附图7页(54)发明名称搜索词推荐方法、设备及存储介质(57)摘要本申请实施例提供一种搜索词推荐方法、设备及存储介质。在本申请实施例中,以当前展示页面关联的目标商品的描述信息为基础进行搜索词推荐,可确保推荐的搜索词与目标商品具有较高相关度,实现从商品维度的搜索词推荐;在推荐过程中,结合可控文本生成模型,以及商品类目对搜索词的属性偏好,生成实体类型和顺序可控的多个候选搜索词;最后,结合多个候选搜索词的质量得分和长度信息从中选择目标搜索词并展示,以供用户基于所推荐的目标搜索词直接发起搜索操作,提高搜索效率。在目标搜索词的推荐过程中,既考虑了目标搜索词中包含的实体词的实体类型及其顺序与商品类目适配性,又考虑了目标搜索词的质量和简洁程度,使得目标搜索词的准确度更高。CN114168843ACN114168843A权利要求书1/3页1.一种搜索词推荐方法,其特征在于,包括:展示第一页面,所述第一页面关联目标商品,所述目标商品属于目标类目,与所述目标类目适配的多个实体类型及其顺序形成目标控制参数;将所述目标商品的描述信息和所述目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词,每个候选搜索词中包括按照所述顺序出现的与所述多个实体类型对应的多个实体词;基于历史搜索词的效能指标数据,预测所述多个候选搜索词的质量得分,结合所述多个候选搜索词的质量得分和长度信息,从所述多个候选搜索词中选择目标搜索词;在所述第一页面上展示所述目标搜索词,以供本端用户基于所述目标搜索词发起搜索。2.根据权利要求1所述的方法,其特征在于,基于历史搜索词的效能指标数据,预测所述多个候选搜索词的质量得分,包括:将所述多个候选搜索词作为模型入参,利用预先训练出的价值评估模型得到所述多个候选搜索词的质量得分;其中,所述价值评估模型是以所述历史搜索词及其质量得分作为训练样本进行模型训练得到的,所述历史搜索词的质量得分是根据所述历史搜索词的效能指标数据计算得到的。3.根据权利要求2所述的方法,其特征在于,所述历史搜索词的效能指标数据包括点击通过率、点击转化率、点击量和询盘量;所述方法还包括:根据所述历史搜索词的点击通过率和点击转化率,计算所述历史搜索词对应的商品转化得分;根据所述历史搜索词的点击量和询盘量,计算所述历史搜索词对应的用户粘性得分;根据所述历史搜索词对应的商品转化得分和用户粘性得分,得到所述历史搜索词的质量得分。4.根据权利要求1所述的方法,其特征在于,结合所述多个候选搜索词的质量得分和长度信息,从所述多个候选搜索词中选择目标搜索词,包括:根据所述多个候选搜索词的长度信息,生成所述多个候选搜索词的长度惩罚分,所述候选搜索词的长度越短,其对应的长度惩罚分越大;根据所述多个候选搜索词的长度惩罚分和质量得分,得到所述多个候选搜索词的整体得分,并选择整体得分最大的候选搜索词作为目标搜索词。5.根据权利要求4所述的方法,其特征在于,根据所述多个候选搜索词的长度信息,生成所述多个候选搜索词的长度惩罚分,包括:针对每个候选搜索词,计算所述候选搜索词中各实体词的条件概率;根据各实体词的条件概率,计算所述候选搜索词的出现概率;利用所述候选搜索词的长度信息的负倒数,对所述候选搜索词的出现概率进行修正,得到所述候选搜索词的长度惩罚分;其中,所述实体词的条件概率是指所述实体词在以所述目标商品的描述信息和所述目标控制参数作为模型入参且在其前面所有实体词均出现的情况下出现在所述候选搜索词中的概率。2CN114168843A权利要求书2/3页6.根据权利要求1所述的方法,其特征在于,在将所述目标商品的描述信息和所述目标控制参数作为模型入参,利用预先训练出的可控文本生成模型生成多个候选搜索词之前,还包括:从搜索日志中获取与所述目标商品相关的网络行为数据作为目标网络行为数据,并根据所述目标网络行为数据确定所述目标商品是否满足特定商品条件;针对