一种文本要素抽取方法及系统.pdf
英哲****公主
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
一种文本要素抽取方法及系统.pdf
本发明提供一种文本要素抽取方法及系统,首先获取目标文本,按照预设业务规则对目标文本的文本内容进行段落分割,将目标文本拆分为多个段落文本;获取每个段落文本的文本内容;利用预训练模型对每个段落文本中的句子进行编码,得到对应的编码结果;通过卷积神经网络从编码结果中聚合每个句子的内部信息,获取每个句子的表征;通过条件随机场从每个句子的表征中获取对应句子的上下文信息,得到目标文本的要素信息。由此可知,本发明提出了基于长文本预训练模型段落级的要素抽取方案,不仅能够解决传统模型输入长度的限制和无法充分利用上下文信息,而
一种长文本的关键要素抽取方法、系统及终端设备.pdf
本发明提供了一种长文本的关键要素抽取方法、系统及终端设备,该关键要素抽取方法包括将标注样本集划分为训练集、验证集和测试集;对训练集进行基于语义的数据增强,得到增强集;通过增强集对多个关键要素抽取基模型进行参数更新;通过将未标注样本转换为已标注价值样本集对训练集进行扩充后进行循环训练;最终确认最优关键要素抽取基模型等步骤。该关键要素抽取系统包括数据增强模块、模型优化模块和样本扩充模块等模块;该终端设备包括存储器、处理器以及存储在所述存储器中并可以在所述处理器上运行的计算机程序;本发明解决了基于传统小样本学习
基于深度学习模型的信访要素抽取方法及抽取系统.pdf
本发明公开了一种基于深度学习模型的信访要素抽取方法、抽取系统、电子设备及计算机可读存储介质,包括:提取信访件的文本内容中目标文本数据;对目标文本数据进行预处理,生成针对多种深度学习模型的对应的数据;将预处理后的多种文本数据中的关于信访人的相关信息、受信人相关信息以及信访诉求的文本数据输入到要素抽取模型中进行要素抽取;将关于信访内容以及信访目的的文本数据输入到文本分类模型中进行分类,分别得到要素抽取的结果以及文本分类的结果;将得到的要素抽取的结果以及文本分类的结果推送到终端设备。该方法采用多种模型,能适应不
一种金融文本实体关系抽取方法及系统.pdf
本发明公开了一种金融文本实体关系抽取方法,涉及人工智能领域的技术领域,具体方案为:S1:在金融数据集上使用BERT预训练单词嵌入;S2:建立实体关系图:以金融文本中的实体作为节点,实体所在的文本作为节点之间的关系边;S3:更新实体关系图:通过关系边的转移矩阵对节点嵌入使用聚合函数更新节点嵌入,重复更新实体关系图;S4:预测关系类别:从S3过程中获取若干次更新实体关系图的各层目标实体对嵌入的输出,经变换拼接后送入多层感知机进行分类,选择概率最大的类别作为关系输出。本发明建立在金融数据基础上,因此对金融领域文
一种中英文本实体关系抽取方法、系统及设备.pdf
本发明公开了一种中英文本实体关系抽取方法、系统及设备,接着将实体抽取结果结合提示微调模板输入中英文本实体关系抽取网络中,进行英文本实体关系抽取;本发明使用了大规模语言模型使用了有监督训练,完全可以适应大规模数据集。本发明设计的提示模板与现有的提示模板设计理念不同,因为本发明更注重模型对实体信息的侧重,而现有的提示模板大多数只关注于单个任务,即本发明的提示模板用于单语言信息抽取依旧是可行的。同时在训练模型的数据预处理方面不需要进行双语单词嵌入映射,大大减少了不同语种在语法不同的情况下导致映射出错,解决了训练