预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115796171A(43)申请公布日2023.03.14(21)申请号202211536109.8(22)申请日2022.12.02(71)申请人北京金山数字娱乐科技有限公司地址100085北京市海淀区西二旗中路33号院5号楼11层002号(72)发明人赵硕丰(74)专利代理机构北京智信禾专利代理有限公司11637专利代理师李东海(51)Int.Cl.G06F40/284(2020.01)G06F40/216(2020.01)权利要求书2页说明书17页附图5页(54)发明名称关键词确定方法及装置(57)摘要本申请提供关键词确定方法及装置,其中所述关键词确定方法包括:获取目标对话文本,并提取所述目标对话文本中的至少一个词语和各词语的词特征,其中,所述目标对话文本中包含至少两个对话对象对应的子对话文本;针对任一对话对象,根据各词语的词特征和该对话对象对应的子对话文本,利用预设的重要度预测模型,确定该对话对象的目标重要度;针对任一词语,基于该词语的词特征和各对话对象的目标重要度,利用预设的关键度预测模型,确定该词语的目标关键度;根据各词语的目标关键度,确定所述目标对话文本中的目标关键词。可以根据对话对象的目标重要度更好地抽取关键词,提高关键词的确定效率和准确率。CN115796171ACN115796171A权利要求书1/2页1.一种关键词确定方法,其特征在于,包括:获取目标对话文本,并提取所述目标对话文本中的至少一个词语和各词语的词特征,其中,所述目标对话文本中包含至少两个对话对象对应的子对话文本;针对任一对话对象,根据各词语的词特征和该对话对象对应的子对话文本,利用预设的重要度预测模型,确定该对话对象的目标重要度;针对任一词语,基于该词语的词特征和各对话对象的目标重要度,利用预设的关键度预测模型,确定该词语的目标关键度;根据各词语的目标关键度,确定所述目标对话文本中的目标关键词。2.根据权利要求1所述的方法,其特征在于,所述重要度预测模型包括词语子重要度预测模型和对话对象子重要度预测模型;针对任一对话对象,根据各词语的词特征和该对话对象对应的子对话文本,利用预设的重要度预测模型,确定该对话对象的目标重要度,包括:根据各词语的词特征,利用所述词语子重要度预测模型,确定各词语的初始重要度;针对任一对话对象,根据所述初始重要度和该对话对象对应的子对话文本,利用所述对话对象子重要度预测模型,确定该对话对象的目标重要度。3.根据权利要求2所述的方法,其特征在于,根据所述初始重要度和该对话对象对应的子对话文本,利用所述对话对象子重要度预测模型,确定该对话对象的目标重要度,包括:确定各词语分别在该对话对象对应的子对话文本中的第一词数,并确定该对话对象对应的子对话文本的第一句子数量;根据所述各词语的所述初始重要度、所述第一词数以及所述第一句子数量,利用所述对话对象子重要度预测模型,确定该对话对象的目标重要度。4.根据权利要求2所述的方法,其特征在于,所述词特征包含至少一个子词特征;根据所述各词语的词特征,利用所述词语子重要度预测模型,确定各词语的初始重要度,包括:获取各子词特征的权重;根据第一词语的所述各子词特征以及所述各子词特征的权重,利用所述词语子重要度预测模型,确定所述第一词语的初始重要度,其中,所述第一词语为任一词语。5.根据权利要求1所述的方法,其特征在于,所述关键度预测模型包括对话对象子关键度预测模型和词语子关键度预测模型;基于该词语的词特征和各对话对象的目标重要度,利用预设的关键度预测模型,确定该词语的目标关键度,包括:基于各对话对象的目标重要度,利用所述对话对象子关键度预测模型,确定各对话对象针对该词语的初始关键度;基于该词语的词特征和所述各对话对象针对该词语的初始关键度,利用所述词语子关键度预测模型,确定该词语的目标关键度。6.根据权利要求5所述的方法,其特征在于,基于各对话对象的目标重要度,利用所述对话对象子关键度预测模型,确定各对话对象针对该词语的初始关键度,包括:确定该词语在第一子对话文本中的第二词数,以及确定该词语在所述目标对话文本中的第三词数,其中,所述第一子对话文本为第一对话对象的子对话文本,所述第一对话对象2CN115796171A权利要求书2/2页为任一对话对象;根据所述第二词数、所述第三词数以及所述第一对话对象的目标重要度,利用所述对话对象子关键度预测模型,确定所述第一对话对象针对该词语的初始关键度。7.根据权利要求1所述的方法,其特征在于,提取所述目标对话文本中的至少一个词语和各词语的词特征,包括:对所述目标对话文本进行词语提取处理,得到至少一个初始词语;根据各初始词语分别在所述目标对话文本中的位置信息和数量信息,从所述至少一个初始词语筛选出