预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113934823A(43)申请公布日2022.01.14(21)申请号202111280835.3G06K9/62(2022.01)(22)申请日2021.11.01G06N3/04(2006.01)G06N3/08(2006.01)(71)申请人阳光保险集团股份有限公司地址518000广东省深圳市福田区红荔西路7002号第一世界广场A座17层(72)发明人张晗杜新凯吕超谷姗姗黄莹(74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙)11463代理人李飞(51)Int.Cl.G06F16/33(2019.01)G06F16/35(2019.01)G06F40/295(2020.01)G06F40/30(2020.01)权利要求书2页说明书10页附图4页(54)发明名称一种语句的改写方法、装置、系统及存储介质(57)摘要本申请提供的一种语句的改写方法、装置、系统及存储介质,该语句的改写方法包括:根据目标实体识别模型获取历史语句中的至少一个实体名词;获取所述至少一个实体名词中各实体名词的时间信息;将待改写语句、所述实体信息和所述时间信息输入目标改写模型,获取所述目标改写模型输出的改写语句。本申请的一些实施例可以可以根据从历史上文中抽取的实体名词及实体名词的产生时间对需要改写的语句进行完善,有效降低了改写耗时的同时提升了改写效率和改写质量。CN113934823ACN113934823A权利要求书1/2页1.一种语句的改写方法,其特征在于,所述改写方法包括:根据目标实体识别模型获取历史语句中的至少一个实体名词;获取所述至少一个实体名词中各实体名词的时间信息;将待改写语句、所述实体信息和所述时间信息输入目标改写模型,获取所述目标改写模型输出的改写语句;其中,所述历史语句是位于所述待改写语句之前的一个语句或多个语句。2.根据权利要求1所述的改写方法,其特征在于,所述目标实体识别模型是通过如下方法训练得到的:对获取的原始历史语句进行预处理,得到预处理后的数据,其中,所述预处理包括去除所述原始历史语句中的噪声和/或将所述原始历史语句中长度大于设定阈值的语句进行切分;将所述预处理后的数据划分为第一训练数据集和第一验证数据集;根据所述第一训练数据集中的数据对构建的初始实体识别模型进行训练,得到预测实体名词和待验证实体识别模型;根据所述第一验证数据集,确认所述待验证实体识别模型通过验证,则得到所述目标实体识别模型。3.根据权利要求2所述的改写方法,其特征在于,所述目标改写模型是通过如下方法训练得到的:将所述预测实体名词、所述预测实体名词的时间信息和第二训练数据包括的待改写语句输入待训练的改写模型,对所述待改写模型进行训练,得到待验证改写模型;根据第二验证数据集,确认所述待验证改写模型通过验证,则得到所述目标改写模型。4.根据权利要求1所述的改写方法,其特征在于,所述实体名词的个数为多个,其中,所述改写方法还包括:对所述多个实体名词分别编码,得到多个不同的实体名词编码标记,其中,一个实体名词对应一个实体名词编码标记;所述将待改写语句、所述实体信息和所述时间信息输入目标改写模型,获取所述目标改写模型输出的改写语句,包括:将所述待改写语句进行拆分并为拆分得到的每个对象进行待改写编码标记,得到待改写编码标记序列;根据所述时间信息从所述多个实体名词中筛选出至少一个目标实体名词,并获取所有目标实体名词对应的实体名词编码标记;获取所述至少一个实体名词在所述待改写语句中的插入位置和/或替换位置;将与所述目标实体名词对应的实体名词编码标记插入所述待改写编码标记序列包括的所述插入位置和/或替换位置处,得到改写标记序列;输出所述改写标记序列。5.根据权利要求4所述的改写方法,其特征在于,所述将所述待改写语句进行拆分,包括:以汉字为拆分单位对所述待改写语句进行拆分。6.根据权利要求1‑5任一项所述的方法,其特征在于,通过如下损失函数确认得到所述待验证实体识别模型和所述待验证改写模型:2CN113934823A权利要求书2/2页其中,L为损失函数,k为待验证实体识别模型的实体样本类别数量,为第i类实体样本的标签分类值,为待验证实体识别模型输出为第i类实体样本的概率,n为待验证改写模型的样本分类标签数量,为第j个样本分类标签的标签分类值,为待验证改写模型输出为第j个样本分类标签的概率。7.一种数据处理方法,其特征在于,执行所述数据处理方法以实现:对根据如权利要求1‑6任一项方法得到的改写语句进行语义理解、问题检索或者情绪识别,分别得到语义理解结果、问题检索结果或者情绪识别结果。8.一种语句的改写装置,其特征在于,所述改写装置包括:实体名词识别模块,被配置为根据目标实体识别模型获取历史语句