预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114297224A(43)申请公布日2022.04.08(21)申请号202111579722.3(22)申请日2021.12.22(71)申请人重庆邮电大学地址400065重庆市南岸区南山街道崇文路2号(72)发明人耿道渠耿记磊赵阳春王平江渝(74)专利代理机构重庆市恒信知识产权代理有限公司50102代理人刘小红(51)Int.Cl.G06F16/242(2019.01)G06F16/2453(2019.01)G06F16/2455(2019.01)G06F16/36(2019.01)权利要求书2页说明书7页附图2页(54)发明名称一种基于RDF的异构数据集成与查询系统及方法(57)摘要本发明请求保护一种基于RDF的异构数据集成与查询系统及方法,属于异构数据集成与数据语义处理技术相结合领域,包括:原始数据层、数据封装层、语义层、数据查询层和应用层,原始数据层将异构数据库中的结构化数据或非结构化数据传给数据封装层,数据封装层将封装后的数据传给语义层,语义层将进行语义处理之后的数据传递给数据查询层,数据查询层将数据传递给应用层。针对该架构,基于目前实验室现有实验条件,采用i5‑8400处理器、20G内存、1T硬盘的计算机作为实验平台。所设计的异构数据集成与查询系统及方法可以减少计算机资源的占用,并大大减少数据查询的响应时间,最终经本发明得到的数据内容及格式与预期相符,证明本发明所提系统与方法可行。CN114297224ACN114297224A权利要求书1/2页1.一种基于RDF的异构数据集成与查询系统,其特征在于,包括:原始数据层、数据封装层、语义层、数据查询层和应用层,所述原始数据层将异构数据库中的结构化数据或非结构化数据传给数据封装层,数据封装层将封装后的数据传给语义层,语义层将进行语义处理之后的数据传递给数据查询层,数据查询层将数据传递给应用层,其中,所述原始数据层采用RDFSchema资源描述框架模式对不同数据源进行描述,消除异构数据源的语法异构;采用对数据源中的关系表结构和语义进行分析,消除异构数据源的语义异构;所述数据封装层包括web服务与数据封装模块;数据封装模块分为查询转换器与结果转换器,查询转换器将子查询根据底层不同的数据库转换成相应数据库可识别的子查询;结果转换器根据不同的子查询得到不同的查询结果,再将查询处理结果进行格式转换,生成RDF数据格式的文件;所述语义层包括GlobalSchema和LocalSchema、以及两种模式之间的模式映射;其中GlobalSchema首先构建一个全局本体,其次做全局虚拟视图的语义化描写,最后通过虚拟视图使得在查询过程中不需查询底层异构数据源;其中构建LocalSchema的过程即为对异构数据源的语义描述,可通过Turtle对RDF进行序列化,完成模式创建,Turtle文档由一系列指令、三元组语句或空白行组成;所述数据查询层主要实现对用户请求的处理,包括对请求的优化,对结果的缓存以及对数据源的包装;查询使用语言为SPARQL或SQL所述应用层包括web接口、管理接口和其他接口。2.根据权利要求1所述的一种基于RDF的异构数据集成与查询系统,其特征在于,所述语义层的三元组是一个(主语、谓词、宾语)项的序列,由空格分隔,并在每个三元组之后由’.’结尾,RDF术语有三种类型:RDFURI引用、文字和空白节点;通过RDF根据底层异构数据源数据类型建立相应局部本体以及全局本体,再将其进行模式映射达到互操作,其中模式映射即为LocalSchema到GlobalSchema的映射。3.根据权利要求2所述的一种基于RDF的异构数据集成与查询系统,其特征在于,所述LocalSchema到GlobalSchema的映射通过采用中间映射的方式进行模式映射,即将LocalSchema首先映射成用RDF描述的文件,再将这些描述文件映射到GlobalSchema,前者映射模式为1:1,后者映射模式为n:1,是一种公共数据的描述模型,由Turtle和本体技术描述而成的,该映射方法的中间状态属于数据源的虚拟视图,而非真实存在。4.根据权利要求1所述的一种基于RDF的异构数据集成与查询系统,其特征在于,所述数据查询层包括查询代价优化模块、选择复制模块、查询执行模块、结果缓存模块;其中,查询代价优化模块用于对查询语句进行查询代价的计算并优化成最小代价查询,这一过程可得到查询执行的代价规划文档;所述选择复制模块用于对部分查询数据复制为热点数据;所述查询执行模块主要负责查询计划的执行,当发出请求经过处理的结果返回至查询执行模块;所述结果缓存模块将热点数据缓存至指定的内存空间,方便后期查询,缩短响应时间,并将查询结果以用户希望的格式返