预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113961677A(43)申请公布日2022.01.21(21)申请号202111080660.1(22)申请日2021.09.15(71)申请人北京三快在线科技有限公司地址100080北京市海淀区北四环西路9号2106-030(72)发明人修文超张钦吴忠伙杨一帆(74)专利代理机构北京润泽恒知识产权代理有限公司11319代理人庞静(51)Int.Cl.G06F16/332(2019.01)G06F16/953(2019.01)权利要求书2页说明书16页附图3页(54)发明名称话题文本处理方法、装置、电子设备及可读存储介质(57)摘要本发明实施例提供了一种话题文本处理方法、装置、电子设备及可读存储介质,该方法中,基于网络平台的用户搜索记录,确定网络平台内的热点词,以及,获取网络平台对应的候选话题文本。基于热点词对候选话题文本进行匹配,以从候选话题文本中选择与热点词相关联的候选话题文本,作为目标话题文本。基于目标话题文本,在网络平台中进行话题投放。相较于直接投放的方式,本发明实施例中先基于用户搜索记录,确定网络平台内的热点词。最终投放时,基于该热点词语选择与当前热点相关联的目标话题文本进行投放,确保最终投放的目标话题文本更符合网络平台中用户的需求,进而一定程度上可以提高话题投放的效果。CN113961677ACN113961677A权利要求书1/2页1.一种话题文本处理方法,其特征在于,所述方法包括:基于网络平台的用户搜索记录,确定所述网络平台内的热点词,以及,获取所述网络平台对应的候选话题文本;基于所述热点词对所述候选话题文本进行匹配,以从所述候选话题文本中选择与所述热点词相关联的候选话题文本,作为目标话题文本;基于所述目标话题文本,在所述网络平台中进行话题投放。2.根据权利要求1所述的方法,其特征在于,所述基于网络平台的用户搜索记录,确定所述网络平台内的热点词,包括:根据所述网络平台中的用户搜索记录,获取备选种子词;根据所述备选种子词的第一被搜索次数,计算所述备选种子词的当前热度值;所述第一被搜索次数是在距离当前第一时长的第一历史时段内的被搜索次数,所述当前热度值与所述第一被搜索次数正相关;若所述当前热度值大于预设热度值阈值,则将所述备选种子词确定为所述热点词。3.根据权利要求2所述的方法,其特征在于,所述根据所述网络平台的用户搜索记录,获取备选种子词,包括:根据所述用户搜索记录对应的搜索文本,提取搜索实体词;确定各所述搜索实体词在距离当前第三时长的第三历史时段内的被搜索次数以及搜索用户数;在所述被搜索次数不小于第一阈值以及所述搜索用户数不小于第二阈值的情况下,将所述搜索实体词确定为所述备选种子词。4.根据权利要求2所述的方法,其特征在于,所述根据所述备选种子词的第一被搜索次数,计算所述备选种子词的当前热度值,包括:确定所述第一被搜索次数与所述第一历史时段内发生的总搜索次数的比值,得到第一相对搜索数,以及,计算第二被搜索次数与第二历史时段内发生的总搜索次数的比值,得到第二相对搜索数;所述第二被搜索次数为所述备选种子词在距离当前第二时长的第二历史时段内被搜索的次数,所述第二时长大于所述第一时长;根据所述第一被搜索次数、所述第一相对搜索数以及所述第二相对搜索数,计算所述备选种子词的当前热度值;所述当前热度值与所述第一相对搜索数正相关,与所述第二相对搜索数负相关。5.根据权利要求1至4中任一所述的方法,其特征在于,所述方法还包括:对于任一所述热点词,获取所述热点词在距离当前第四时长的第四历史时段内的第三被搜索次数,以及,所述第三被搜索次数与搜索次数均值的比值;所述搜索次数均值为距离当前第五时长的第五历史时段内的第四被搜索次数的均值;在所述第三被搜索次数不大于预设次数阈值,和/或,所述比值不大于预设比值阈值的情况下,剔除所述热点词。6.根据权利要求1至4中任一所述的方法,其特征在于,所述获取所述网络平台对应的候选话题文本,包括:从所述网络平台内的用户生成内容UGC文本中,选择包含预设基础词的UGC文本,以作为目标UGC文本;所述预设基础词在所述网络平台的出现次数大于预设次数阈值;2CN113961677A权利要求书2/2页根据所述目标UGC文本中包含的词语,生成话题词组;根据所述话题词组以及预设话题模板,生成所述候选话题文本。7.根据权利要求6所述的方法,其特征在于,所述根据所述话题词组以及预设话题模板,生成所述候选话题文本之前,所述方法还包括:对所述话题词组中的同义词组进行过滤;其中,所述同义词组中包含的至少两个词语为同义词;和/或,检测所述话题词组的成立概率;基于所述成立概率剔除不成立的话题词组。8.根据权利要求6所述的方法,其特征在于,所述根据所述