预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113901778A(43)申请公布日2022.01.07(21)申请号202111277389.0G06F16/35(2019.01)(22)申请日2021.10.29G06N3/08(2006.01)G06N20/00(2019.01)(71)申请人深圳证券信息有限公司地址518000广东省深圳市福田区红荔西路203栋606室(72)发明人毛瑞彬朱菁潘斌强杨雯雯刘金香孙德旺武李爱张俊杨建明张大千(74)专利代理机构北京集佳知识产权代理有限公司11227代理人王学强(51)Int.Cl.G06F40/186(2020.01)G06F40/284(2020.01)G06F40/242(2020.01)权利要求书3页说明书12页附图3页(54)发明名称一种问询函生成方法、系统及其装置(57)摘要本申请实施例公开了一种问询函生成方法、系统及其装置,用于针对发行方招股书中的异常审核点生成问询函,辅助人工撰写,节省人力和时间。本申请实施例方法包括:获取目标生成模型,所述目标生成模型由历史问询函和历史招股书对初始生成模型进行机器学习训练得到,所述目标生成模型中保存有用于生成目标问询函的规则字典,所述历史问询函与所述历史招股书具有对应关系,且所述历史问询函根据所述历史招股书生成,所述规则字典通过对历史问询函和历史招股书进行机器学习并结合人工经验得到;获取目标招股书的文本向量;将所述目标招股书的文本向量输入所述目标生成模型,所述目标生成模型根据所述规则字典输出所述目标招股书对应的目标问询函。CN113901778ACN113901778A权利要求书1/3页1.一种问询函生成方法,其特征在于,包括:获取目标生成模型,所述目标生成模型由历史问询函和历史招股书对初始生成模型进行机器学习训练得到,所述目标生成模型中保存有用于生成目标问询函的规则字典,所述历史问询函与所述历史招股书具有对应关系,且所述历史问询函根据所述历史招股书生成,所述规则字典通过对历史问询函和历史招股书进行机器学习并结合人工经验得到;获取目标招股书的文本向量;将所述目标招股书的文本向量输入所述目标生成模型,所述目标生成模型根据所述规则字典输出所述目标招股书对应的目标问询函。2.根据权利要求1所述的问询函生成方法,其特征在于,在所述获取目标生成模型之前,所述方法还包括:获取所述历史问询函和所述历史招股书,并运用文本向量算法获取所述历史问询函和所述历史招股书的文本向量;将所述历史问询函和所述历史招股书的文本向量作为训练样本输入所述初始预测模型,使用所述训练样本对所述初始生成模型进行机器学习训练得到所述目标生成模型,所述目标生成模型中保存有所述规则字典。3.根据权利要求1所述的问询函生成方法,其特征在于,所述规则字典通过对历史问询函和历史招股书进行机器学习并结合人工经验得到包括:运用分类算法将所述历史问询函分解为问询背景段落和问询问题段落,并识别所述问询问题段落中包含的细分问题,其中,一个审核要点对应至少一个所述问询背景段落和至少一个所述问询问题段落,同一所述审核要点对应的所述问询背景段落和所述问询问题段落具有关联关系;确定所述细分问题对应的审核要点,其中,一个所述审核要点对应至少一个所述细分问题,并形成表示所述审核要点和所述细分问题的对应关系的第一目录;获取所述细分问题中包含的关键词,将所述关键词作为所述细分问题的问询方向;对每个所述审核要点对应的所述细分问题按照问询方向分别进行聚类,得到表示所述审核要点、所述问询方向和所述细分问题的对应关系的第二目录,其中,一个所述审核要点对应至少一个所述问询方向,一个所述问询方向对应至少一个所述细分问题;将所述细分问题输入至神经网络算法模型生成问题模板,并得到表示所述审核要点、所述问询方向和所述问题模板的对应关系的第三目录,其中,一个所述审核要点对应至少一个所述问询方向,一个所述问询方向对应至少一个所述问题模板;根据所述细分问题确定所述审核要点的触发条件,得到表示所述审核要点、所述问询方向、所述问题模板和所述触发条件的对应关系的第四目录,所述触发条件用来判断是否要对所述审核要点进行问询;对所述问询背景段落和所述历史招股书进行机器学习获得用于生成所述问询背景段落的摘要改写规则;所述规则字典包括所述第四目录和所述摘要改写规则。4.根据权利要求3所述的问询函生成方法,其特征在于,所述获取所述细分问题中包含的关键词,将所述关键词作为所述细分问题的问询方向包括:对所述细分问题进行基于词的粒度的分词匹配得到预处理分词集合,运用文本向量算2CN113901778A权利要求书2/3页法和文本分类算法对所述预处理分词集合进行处理得到关键词种子词库;对所述关键词种子词库进行基于人工经验的近