半监督的命名实体识别.docx
快乐****蜜蜂
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
半监督的命名实体识别.docx
半监督的命名实体识别半监督学习是机器学习中的重要分支之一。它是指在一定的数据集上,利用有标签数据和无标签数据进行训练,从而达到提高模型性能、减少标注量的目的。在命名实体识别问题中,半监督学习也被广泛应用。为了更好地探讨半监督学习在命名实体识别中的应用,本文将分为三个部分来进行讨论。一、命名实体识别的基本思路在自然语言处理领域,命名实体识别指的是从文本中识别出具有特定意义的实体。例如,在一篇新闻报道中,命名实体可以指涉人、地点、组织机构等实体。命名实体识别是解决一些具体应用的关键问题,比如信息抽取、机器翻译
远程监督命名实体识别研究.docx
远程监督命名实体识别研究远程监督命名实体识别研究摘要命名实体识别(NamedEntityRecognition,NER)是信息抽取和自然语言处理领域的重要任务。然而,NER面临着标注数据稀缺和困难的问题。远程监督是一种基于外部知识库(如维基百科)的数据标注方法,可以帮助解决NER中的标注问题。本论文研究了远程监督命名实体识别的方法和技术,分析了其优点和局限性,并提出了未来的研究方向。1.引言命名实体识别(NER)是从文本中识别出名字、地点、组织机构等命名实体的任务。NER在信息抽取、问答系统、机器翻译等应
一种未标注数据的半监督命名实体识别的方法.pdf
本发明公开了一种未标注数据的半监督命名实体识别的方法,包括:数据分组、建立识别模型、交叉验证、文本标注、置信度计算和识别训练等步骤,综合多种常用模型的优势,最大程度的降低训练集中噪声数据的干扰,同时本方法并不用训练基于二分类的打分器。目前市面上少量标注文本命名识别算法无法充分挖掘出大量未标注的文本中的信息和降低相应由于少量标注文本带来噪声。该方法还可以通过调整置信度α,来调整最后模型的召回率和精度,在不同场景下使用不同的置信度来满足不同场景下对召回率和精度的不同要求。
一种半监督式命名实体识别方法、系统及电子设备.pdf
本发明提供一种半监督式命名实体识别方法、系统及电子设备,对文本数据进行资料格式转化、文本分词、词向量处理以及命名实体信息标注处理;对处理后的文本数据进行训练;基于命名实体识别模型对待识别数据集进行标注,得到带有弱标注的待识别数据集,随后选择弱标注的待识别数据集的子集与初始训练集合作为新的本轮训练集进行重复训练直至命名实体识别模型收敛,命名实体识别模型在多次重复训练过程获取待识别词汇数据集的特征信息,提升对特征信息的识别性能。本发明可以减少大量文本数据标注的工作量,同时联合训练可以提升命名实体识别模型的泛化
基于半监督多特征模型的中文医疗文本命名实体识别方法研究.docx
基于半监督多特征模型的中文医疗文本命名实体识别方法研究基于半监督多特征模型的中文医疗文本命名实体识别方法研究摘要:医疗文本的命名实体识别(NER)是医疗信息处理中重要的步骤之一。传统的监督学习方法在数据标注上昂贵且耗时,而半监督学习方法可以借助未标注数据提高模型性能。本论文提出了一种基于半监督多特征模型的中文医疗文本NER方法。该方法利用已标注数据与未标注数据进行联合训练,通过多特征融合提高NER模型的性能。实验结果表明,该方法在中文医疗文本NER任务中取得了较好的性能。关键词:命名实体识别;半监督学习;