文本识别方法、装置、计算机可读介质及电子设备.pdf
是你****平呀
亲,该文档总共26页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
文本识别方法、装置、计算机可读介质及电子设备.pdf
本申请的实施例提供了一种文本识别方法、装置、计算机可读介质及电子设备。该文本识别方法包括:在待识别文本中添加第一分类标记,以生成所述待识别文本对应的输入对象;将所述输入对象输入至文本识别模型,所述文本识别模型是根据携带有标注实体标签以及标注分类标签的目标样本文本训练得到的;获取所述文本识别模型输出的所述待识别文本中各个文字对应的预测实体标签以及所述第一分类标记对应的预测分类标签;根据所述预测实体标签,生成针对所述待识别文本的实体识别结果,并根据所述预测分类标签,生成针对所述待识别文本的分类结果。本申请实施
文本结构化识别方法、装置、电子设备和计算机可读介质.pdf
本公开的实施例公开了文本结构化识别方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:对目标图像中的文本进行识别,得到目标文本信息;根据上述目标文本信息,确定上述目标图像对应的识别模板类别;根据上述识别模板类别对应的光学字符识别算法,对上述目标图像中的文本进行结构化识别,得到文本结构化识别结果。该实施方式实现了提高文本结构化识别的自动化的程度,降低人工成本,提高文本结构化识别的效率。
文本素材的语义识别方法、装置、电子设备和可读介质.pdf
本公开提供一种文本素材的语义识别方法、装置、电子设备和可读介质,其中,文本素材的语义识别方法包括:对待处理的文本素材进行分词处理,以得到分词;按照预设的关注点与关键词之间的对应关系对分词进行匹配处理;若匹配失败,则将文本素材输入至训练好的主题识别模型,主题识别模型输出文本素材对应于各个关注点的概率;根据文本素材对应于各个关注点的概率确定文本素材的语义主题。通过本公开实施例,提高了文本素材的语义识别的可靠性、准确性和效率。
文本识别方法、电子设备和计算机可读存储介质.pdf
本申请实施例涉及互联网技术领域,公开了一种文本识别方法、电子设备和计算机可读存储介质。上述文本识别方法包括:获取包含目标对象名称的待识别文本;遍历预设的目标对象名称的中文内容的集合,将待识别文本中包含的中文内容作为待识别文本的关键词,并得到待识别文本的关键词的集合;根据预设的目标对象名称的全称的集合和关键词的集合,确定各关键词对应的候选全称,并得到候选全称的集合;根据候选全称的集合,确定从待识别文本识别出的目标对象名称。本申请实施例提供的文本识别方法,文本识别过程简洁可视,可以有效提升文本识别的速度和准确
商户识别方法、装置、电子设备及计算机可读介质.pdf
本公开的实施例提供了一种商户识别方法、装置、电子设备及计算机可读介质。该方法包括:获取目标商户注册的目标商户名;对目标商户名进行处理,获得目标商户名的目标商户向量表示;计算目标商户向量表示和历史集合的集合中心向量表示的相似度;根据相似度新建一新增集合作为目标商户名对应的目标集合;根据目标集合的目标集合信息将目标商户确定为目标类型商户,其中,目标类型商户是指利用在预设时间范围内注册的第一数量的商户名以进行非正常交易的商户,第一数量的商户名中的任两个之间的相似度小于预设阈值。本公开实施例提供的技术方案能够提高