预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112348273A(43)申请公布日2021.02.09(21)申请号202011272860.2G06K9/62(2006.01)(22)申请日2020.11.13(71)申请人北京沃东天骏信息技术有限公司地址100083北京市海淀区杏石口路65号西杉创意园四区11号楼东段1-4层西段1-4层申请人北京京东世纪贸易有限公司(72)发明人李浩然(74)专利代理机构北京德琦知识产权代理有限公司11018代理人吴点郑红娟(51)Int.Cl.G06Q10/04(2012.01)G06Q10/06(2012.01)G06Q30/06(2012.01)权利要求书3页说明书9页附图3页(54)发明名称一种信息生成的方法、装置和存储介质(57)摘要本申请公开了一种信息生成的方法、装置和存储介质,具体为首先获取物品描述文本样本和摘要信息样本,并通输入预先训练的创意度预测模型,生成摘要信息样本的创意度分数,基于摘要信息样本和对应的创意度分数,训练得到物品摘要信息生成模型,并在训练时基于摘要信息样本对应的创意度分数中包含的创意度权重,计算物品摘要信息生成模型中的第一损失函数,优化物品摘要信息生成模型,获取待处理物品描述文本并输入物品摘要信息生成模型,生成与待处理物品描述文本对应的摘要信息。本申请实施例通过利用物品描述文本样本的创意度分数对训练样本进行加权,创意度分数越高的创意度权重越高,以使待训练的物品摘要信息生成模型输出创意度较高的摘要信息。CN112348273ACN112348273A权利要求书1/3页1.一种信息生成的方法,其特征在于,包括:获取物品描述文本样本和摘要信息样本;将所述物品描述文本样本和所述摘要信息样本输入预先训练的创意度预测模型,生成所述摘要信息样本的创意度分数;基于所述摘要信息样本和对应的所述创意度分数,训练得到物品摘要信息生成模型,并在训练时基于所述摘要信息样本对应的所述创意度分数中包含的创意度权重,计算所述物品摘要信息生成模型中的第一损失函数,并基于所述第一损失函数优化所述物品摘要信息生成模型;获取待处理物品描述文本,并将所述待处理物品描述文本输入所述物品摘要信息生成模型,生成与所述待处理物品描述文本对应的摘要信息。2.根据权利要求1所述的方法,其特征在于,所述生成所述摘要信息样本的创意度分数的步骤包括:计算所述摘要信息样本中包含的至少一个样本词的创意度概率,所述创意度概率用于表示所述样本词或所述摘要信息样本所具备创意度的概率;计算所述物品描述文本样本组成的训练集中包含的每个所述样本词的逆文本频率指数,以及,计算每个所述样本词的所述逆文本频率指数的均值,并将每个所述样本词的所述逆文本频率指数与均值的比值作为所述样本词的通用度分数,所述通用度分数用于表示所述样本词或所述摘要信息样本作为所述摘要信息样本的使用频率;将所述摘要信息样本包含的每个所述样本词的所述创意度概率的均值作为所述摘要信息样本的所述创意度概率,以及,将所述摘要信息样本包含的每个所述样本词的所述通用度分数的均值作为所述摘要信息样本的所述通用度分数,并基于预设权重系数为所述创意度概率和所述通用度分数分配对应的创意度权重并求和,以生成所述摘要信息样本的所述创意度分数。3.根据权利要求2所述的方法,其特征在于,所述计算所述摘要信息样本中包含的至少一个样本词的创意度概率的步骤包括:将所述摘要信息样本输入所述创意度预测模型中的创意度概率分类器,生成所述摘要信息样本中包含的至少一个所述样本词的创意度概率,其中,所述创意度概率分类器的训练过程为:当所述样本词包含创意词信息时,通过待训练的所述创意度概率分类器生成所述样本词的预测创意度概率,通过所述预测创意度概率和预先确定的所述样本词的实际创意度概率计算交叉熵,确定所述预测创意度概率分类器的第二损失函数,进行迭代训练,确定所述预测创意度概率分类器。4.根据权利要求1所述的方法,其特征在于,所述对待训练的物品摘要信息生成模型进行训练的步骤包括:基于所述摘要信息样本包含的至少一个样本词,生成所述样本词作为所述摘要信息样本的概率;根据所述样本词可作为所述摘要信息样本的概率和所述样本词的所述创意度概率生成的损失函数,以及所述第二损失函数,生成所述待训练的物品摘要信息生成模型的所述第一损失函数,并基于所述第一损失函数对所述待训练的物品摘要信息生成模型进行训2CN112348273A权利要求书2/3页练,确定所述物品摘要信息生成模型。5.一种信息生成的装置,其特征在于,包括:获取模块,用于获取物品描述文本样本和摘要信息样本;第一生成模块,用于将所述物品描述文本样本和所述摘要信息样本输入预先训练的创意度预测模型,生成所述摘要信息样本的创意度分数;训练模块,