一种文本分类方法、装置、处理设备和票据分类系统.pdf
一只****ua
亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种文本分类方法、装置、处理设备和票据分类系统.pdf
本说明书提供一种文本分类方法、装置、处理设备和票据分类系统。一个方法实施例中,可以利用一个或多个模型算法对文本数据进行调优,增加文本覆盖度,增加文本质量,从而整体提升分类准确性。本说明书实施例方案可以快速构建轻量级文本分类方案,并将多个模型的分类结果合并后作为输出,不但处理文本的质量得到提升,输出结果更加可靠,而且整体模型简单、复杂度低,能够快速迭代产生分类结果,提高了分类模型构建效率和文本分类处理效率。
票据分类方法、票据分类装置、电子设备和存储介质.pdf
本公开提供了一种票据分类方法及装置,可以应用于人工智能技术领域和金融领域。该票据分类方法包括:获取待分类票据图像,其中,待分类票据图像是对初始票据图像进行剪裁而生成的;将待分类票据图像输入预先训练完成的票据识别模型,输出第一识别结果,其中,第一识别结果包括待分类票据图像中的文本位置和文本内容;基于第一识别结果,从票据模板库中确定与第一识别结果相匹配的目标票据模板,其中,票据模板库中的票据模板的尺寸与待分类票据图像的尺寸相对应;以及根据目标票据模板生成分类结果。此外,本公开还提供了一种票据分类装置、一种电子
数据处理、文本分类模型的训练、文本分类方法和装置.pdf
本说明书实施例提供一种数据处理方法和装置、文本分类模型的训练方法和装置,以及文本分类方法和装置,将第一待处理文本信息划分为N组,根据其中N‑1组训练文本信息训练第一文本分类模型,并通过所述第一文本分类模型对剩余第一待处理文本信息进行预测,获取所述剩余第一待处理文本信息的预测类别,根据所述剩余第一待处理文本信息的预测类别与真实类别对所述剩余第一待处理文本信息进行过滤,以从所述剩余第一待处理文本信息中获取训练文本信息。通过本说明书实施例方案,能够从大量的第一待处理文本信息中自动过滤掉低质量数据,得到高质量的训
文本预处理方法、分类方法、装置及设备.pdf
本说明书实施例提供一种文本预处理方法、分类方法、装置及设备。在获取待处理文本后,可以判断待处理文本的长度是否大于指定长度,如果大于,则以待处理文本中至少一个指定字符作为位置参考,从文本中截取出多个字符,并将截取的字符拼接,得到长度等于指定长度的新文本,然后用新文本对预设的语言模型进行训练。通过对长文本进行截断拼接,可以从长文本中截取表示核心内容的关键字符,拼接得到长度满足语言模型要求的新文本,再通过新文本对语言模型进行训练,使得长文本可以得到模型的支持,且通过模型对长文本中的核心内容的学习,提升了模型的性
文本分类模型的训练方法、文本分类方法、装置和设备.pdf
本申请提供一种文本分类模型的训练方法、文本分类方法、装置和设备,该方法包括:获取多条浏览器的历史弹窗内的文本信息;对每个文本信息进行分词处理,根据分词结果确定出每个文本信息对应的第一特征向量;对第一特征向量进行聚类,得到至少一个文本信息组;从每个文本信息组中,分别选出至少一条目标文本信息,并对每个目标文本信息添加类型标识,以形成至少一个文本信息模板;根据至少一个文本信息模板,对初始文本分类模型进行训练,得到文本分类模型。通过该方法,能够解决现有技术中无法对浏览器弹窗日志进行分析的问题,基于训练得到的文本分