基于分词和命名实体识别的文本重组方法及装置、介质.pdf
玄静****写意
亲,该文档总共24页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
基于分词和命名实体识别的文本重组方法及装置、介质.pdf
本公开是关于一种基于分词和命名实体识别的文本重组方法及装置、介质,涉及自然语言处理领域。本公开提供的一种基于分词和命名实体识别的文本重组方法,包括:接收到待处理的文本后,根据文本中每个词语的属性信息,以及文本中每个命名实体的属性信息,确定文本中每个字符的属性信息;并根据每个字符的属性信息,确定每字符与其相邻位置的字符之间的关联关系,根据所述关联关系对所述文本进行重组,得到重组结果集,重组结果集中包括构成文本的所有词语和/或命名实体的属性信息。本公开的技术方案对待处理的文本进行重新组合与渲染,实现多样性标注
一种命名实体识别的方法和装置.pdf
本申请提供一种命名实体识别的方法和装置,所述方法包括:接收原始文本,分离所述原始文本获取文本单元;根据所述文本单元确定文本单元表示向量;获取所述文本单元对应的拆分特征,根据所述文本单元的拆分特征确定所述原始文本的特征表示向量;根据所述原始文本的特征表示向量和所述文本单元表示向量确定所述原始文本中的命名实体。以文本单元对应的拆分特征作为最小元素进行处理,这样可以最大程度保留文本单元作为象形字或形声字的内在特征,保留文本单元间内在的特征,提高命名实体识别的准确度。
命名实体识别方法、装置、设备、介质和程序产品.pdf
本申请涉及人工智能技术领域,公开了一种命名实体识别方法、装置、设备、介质和程序产品,用于基于蒸馏学习的模型进行命名实体识别任务。方法部分包括:获取被识别句子;将被识别句子输入已训练得到的目标神经网络模型,得到被识别句子的词语属于第一标签集的各个第一标注标签的第一预测概率值,以及属于第二标签集的各个第二标注标签的第二预测概率值;将第一预测概率值最大的第一标注标签的标签类型作为词语的第一预测标签类型,并将第二预测概率值最大的第二标注标签的标签类型作为词语的第二预测标签类型;根据词语的第一预测标签类型和第二预测
基于分词的文本处理方法、装置、电子设备和存储介质.pdf
本公开提供了一种基于分词的文本处理方法、装置、电子设备和存储介质,涉及数据处理技术领域,尤其涉及大数据技术领域和云服务技术领域。具体实现方案为:对原始文本进行分词处理,得到多个字组合片段;确定多个字组合片段中每个字组合片段的关联度;去除多个字组合片段中的目标字组合片段,生成至少一个目标文本,其中,目标字组合片段包含的两个字组合片段的关联度小于预设阈值。容易注意到的是,通过计算字组合片段的关联度,过滤目标字组合片段,得到至少一个由至少一个过滤后字组合片段生成的目标文本,无需预先设置目标文本字段长度,进而解决
实体识别的方法和装置、建立词典的方法、设备、介质.pdf
一种命名实体识别的方法包括:获取目标文本(S101);根据预设的条件随机场模型确定目标文本中的待分类词及其词性分类(S102);条件随机场模型包括义原函数和模板函数;每个模板函数用于给出目标文本中的每个字对应每个词性分类的得分;义原函数用于将目标文本中的至少部分词与预设的义原库中的义原匹配,并在词具有匹配的义原时,为该词的每个字给出与该义原在义原库中的类型属性对应的词性分类的得分;条件随机场模型用于根据目标文本中的每个字对应每个词性分类的总得分,确定每个字的词性分类;条件随机场模型还用于确定具有相同词性分