基于关键因子的结构化文本搜索方法.pdf
海昌****姐淑
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
基于关键因子的结构化文本搜索方法.pdf
本发明提出了一种基于关键因子的结构化文本搜索方法,包括:获取项目文件,基于OCR识别算法识别出项目文件的文本脉络信息,结合预设项目文本规则确定项目文件的第一关键因子;在项目文件中搜索第一关键因子,根据搜索到的第一关键因子的分布情况,在项目文件中划分出待搜索区域;通过对待搜索区域进行文本语义分析,搜索到第二关键因子,在第二关键因子与第一关键因子之间建立映射关系,基于所述映射关系处理得到结构化文本。本发明针对不同项目类型的项目文本,确定第一关键因子和第二关键因子,从而获取项目评审相关的关键信息,并形成结构化数
基于权值的结构化搜索系统及其搜索方法.pdf
本发明提供了一种基于权值的结构化搜索系统,包括结构树模块,用于对数据存储模块中的每条非结构化数据进行分词,将其拆分为单独的关键词词汇,对每个关键词词汇定义权值,并根据语法上下文建立一个文本结构树;搜索树模块,用于接收客户端的搜索表达式,对搜索表达式进行分词,将其拆分为单独的关键词词汇,对每个关键词词汇定义权值,并根据语法上下文建立一个搜索树;分析模块,用于将搜索树与所有的文本结构树进行匹配,根据权值计算得出匹配值;显示模块,用于将匹配值以分值从大到小进行排序,将搜索结果显示到客户端。本发明还公开了一种基于
基于云的结构化数据搜索方法.pdf
本发明公开了一种基于云的结构化数据搜索方法,包括以下步骤:第一步,建立一个由多台计算机组成的云平台,各计算机之间通过socket连接起来;在云平台上实现集中管理和SAAS服务;各计算机上设有索引服务和检索服务;第二步,对源数据进行标注,以使数据结构化;第三步,根据源数据的标注结果,建立不同类型的索引,用于搜索。本发明通过建立搜索集群,为其他网站提供搜索服务,网站可以将结构化之后的数据通知给本服务,从而提供根据结构化数据和自定义条件的搜索结果。
基于全局指针解码方法的文本结构化信息抽取方法.pdf
本发明涉及信息抽取方法技术领域,且公开了基于全局指针解码方法的文本结构化信息抽取方法,包括以下算法及模型:(1)面向文本事件信息抽取的向量化表示;(2)统一方式处理嵌套与非嵌套NER任务;(3)设计事件抽取算法并完成模型训练;(4)设计事件关系抽取算法并完成模型训练;(5)完成最优化模型参数的部署对知识进行融合加工。本发明通过全局化的关联文本内容,用归一处理的全局指针解码方法方法来应对命名实体识别任务,不对嵌套实体和非嵌套实体作明确区分,使得形成的模型统一高效的处理两类文本,并将归一化的模型利用到两个抽取
智能结构化搜索系统及其搜索方法.pdf
本发明提供了一种智能结构化搜索系统,包括采集模块,用于采集客户端输入的自然语言查询数据;处理模块,用于对自然语言查询数据进行字符集转换,将中文及非中文数据统一转换为相同字符集,将字符集转换后的自然语言查询数据拆分为单独的关键词词汇,并对每个关键词词汇进行同义词转换;分析模块,用于分析识别处理模块处理后的关键词词汇,根据语义生成逻辑表达式或结构化逻辑树;数据存储模块,用于存储结构化数据及关系数据;查询模块,将逻辑表达式或结构化逻辑树与数据存储模块中的数据进行对比,并将查询结果输出。本发明还公开了一种智能结构