预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113988058A(43)申请公布日2022.01.28(21)申请号202111248492.2(22)申请日2021.10.26(71)申请人平安普惠企业管理有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)(72)发明人苏煜竣(74)专利代理机构深圳市明日今典知识产权代理事务所(普通合伙)44343代理人王杰辉(51)Int.Cl.G06F40/274(2020.01)权利要求书3页说明书11页附图2页(54)发明名称文本生成方法、装置、计算机设备和存储介质(57)摘要本申请涉及人工智能领域,提供了一种文本生成方法、装置、计算机设备和存储介质,当通过预设的文字生成模型进行文本生成,生成第k个字时,根据第k个字得到对应的第二候选集;检测第二候选集中是否存在与预设的结束标记相同的文本符号;若第二候选集中不存在与预设的结束标记相同的文本符号,根据前k‑1个字的第一候选集中的文本符号得到新的第k个字,并根据新的第k个字生成新的第二候选集,直至新的第二候选集中存在与预设的结束标记相同的文本符号,将与预设的结束标记相同的文本符号取出作为第k+1个字得到目标文本。通过本申请提供的文本生成方法、装置、计算机设备和存储介质,能够将生成的目标文本控制在固定长度内。CN113988058ACN113988058A权利要求书1/3页1.一种文本生成方法,其特征在于,待生成的目标文本的最大长度为k+1个字,其中,k为大于等于1的整数,包括以下步骤:当通过预设的文字生成模型进行文本生成,生成第k个字时,根据所述第k个字得到所述第k个字对应的第二候选集;其中,生成的前k‑1个字中任意一个字都对应有一个第一候选集,将各个第一候选集对应的字的编号作为对应的第一候选集的下标,各个所述第一候选集和第二候选集中均包括有若干文本符号,各个所述第一候选集和所述第二候选集中的文本符号由对应的字输入文字生成模型得到;检测所述第二候选集中是否存在与预设的结束标记相同的文本符号;所述结束标记包括结束符、标点符或表情符;若所述第二候选集中不存在与预设的结束标记相同的文本符号,根据前k‑1个字所对应的第一候选集中的文本符号得到新的第k个字,并根据新的第k个字生成新的第二候选集,直至新的第二候选集中存在与预设的结束标记相同的文本符号,将与预设的结束标记相同的文本符号取出作为第k+1个字得到目标文本。2.根据权利要求1所述的文本生成方法,其特征在于,所述通过预设的文字生成模型进行文本生成直到生成第k个字和对应的第二候选集的步骤,包括:获取文本生成过程中最新的一个字作为初始字词;将所述初始字词输入预设的文字生成模型进行文字生成,得到字表;其中,所述文字生成模型基于GPT2模型训练得到;计算字表中所有文本符号作为所述初始字词的下一个字的概率;根据所述概率从所述字表中确定一个文本符号作为所述初始字词的下一个字,并根据所述概率从字表按照预设方法选择若干文本符号组成所述初始字词对应的所述第一候选集;直至生成第k个字,以及根据所述第k个字得到第二候选集。3.根据权利要求2所述的文本生成方法,其特征在于,所述根据所述概率从所述字表中确定一个文本符号作为所述初始字词的下一个字,并根据所述概率从字表按照预设方法选择若干文本符号组成所述初始字词对应的所述第一候选集的步骤,包括:根据所述概率确定所述初始字词的下一个字;根据所述概率,通过核采样方法得到第一候选子集;根据所述概率,通过TopK方法得到第二候选子集;将所述第一候选子集和所述第二候选子集的交集作为所述初始字词对应的第一候选集。4.根据权利要求1所述的文本生成方法,其特征在于,所述根据前k‑1个字的第一候选集中的文本符号得到新的第k个字,并根据新的第k个字生成新的第二候选集,直至新的第二候选集中存在与预设的结束标记相同的文本符号的步骤,包括:从下标为k‑1的第一候选集中获取一个文本符号作为新的第k个字,根据新的第k个字得到新的第二候选集,并检测新的第二候选集中是否存在与预设的结束标记相同的文本符号;若下标为k‑1的第一候选集中的所有文本符号作为新的第k个字,并对应得到的新的第二候选集中均不存在与预设的结束标记相同的文本符号时,从下标为k‑2的第一候选集中获取一个文本符号作为新的第k‑1个字,根据新的k‑1个字确定新的第k个字,根据新的第k2CN113988058A权利要求书2/3页个字确定新的第二候选集,并检测新的第二候选集中是否存在与预设的结束标记相同的文本符号,直至新的第二候选集中存在与预设的结束标记相同的文本符号。5.根据权利要求2所述的文本生成方法,其特征在于,所述根据前k‑1个字的第一候选集中的文本