预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于XML异构数据源集成的研究摘要:针对异构数据集成过程中的模式转换问题,提出一种XML模式与关系库模式的转化方法,通过定义XMLSchema与关系模式之间的转换规则,以XMLSchema文档树生成的结点树为基础,实现了XML模式与关系模式的映射。该方法的最大特点是它不仅可以反映数据的结构特征,而且还能表示数据的语义约束。论文关键词:XML模式;关系模式,数据集成,异构数据源在企业实施信息化进程中,由于企业内各部门的业务和功能归属不同,以及各企业信息化水平存在差异等原因,造成企业拥有许多相互隔离的、由不同核心技术构建的信息服务和管理系统.系统中数据的表示不同,数据交流效果极差,形成“信息孤岛”,从而使得企业内以及企业间的协作效率与效果很不理想。如何将这些异构的数据源集成起来,实现有效的信息查询,就成为了一个迫切需要解决的问题[1]。只有将这些孤立的数据源集成起来,提供给用户一个统一的视图,才能从这些资源数据中获取人们所需要的信息。而为大量各种各样的数据提供某种统一的表示方法无疑是解决问题的关键,这就要求能找到一种标准、开放的数据结构来表示数据信息。XML的出现无疑为异构数据源的集成带来了新的希望。它以一种开放的自我描述方式定义数据结构,在描述数据内容的同时能突出对结构的描述,从而体现出数据之间的关系。同时,本文对关系数据库的完整性约束进行研究,定义了XML模式和关系数据库模式的映射模型,通过对XML模式[3][4]的简化和扩展,提出了一种能够完成XML模式和关系模式之间转换的解决方案。2XML简介XML为可扩展标记语言(ExtensibleMarkupLanguage)的缩写,是一种具有数据描述功能、高度结构性及可验证性的语言。和HTML一样,XML同样使用标记与属性;和HTML的最大的不同点在于XML的标记与属性允许用户自行定义,并可以按照所定义的标记与属性的语法来开发应用程序,因而具有很好的扩展性。在XML文件中,可以使用标记来描述数据,或配合属性来辅助描述数据,因此XML十分适合用于作为标准的描述语言;由于可以借助验证规则(DTD或XMLSchema)来规范一个XML文件的内容与结构,保证XML文档的有效性,所以XML又很适合作为一种数据交换的格式[2]。3基于XML模式的数据源集成解决方案3.1集成策略在整体结构上采用“数据交换中心”的思想来有效解决不同企业应用系统之间的协同工作。通过采用统一的数据交换标准,使各应用系统与数据交换中心相连,利用数据交换中心来实现数据共享和路由,由于隔离了数据存储层和应用层,使得应用与其底层的数据结构和存储方式无关,从而不需要对原有业务系统进行改造,也不需要对已有的业务流程重新开发。基于数据安全性、系统性能、系统扩展性和实施难度等方面的考虑,整个体系结构在物理拓扑上采用星型结构(如下图所示)。3.2集成框架数据交换中心之所以能够交换基于不同操作平台和数据库的数据,主要得益于其对信息的统一表示、完整的消息服务能力以及功能完备的交换平台软件系统。信息的统一表示依靠元语言标准、信息标准、元数据标准、显示标准、解析、转换和封装标准来保证。完整的消息服务能力依靠信息的统一封装、统一编址、信息的可靠性传输、路由管理等技术手段实现。交换平台软件系统一般采用基于基础/中心数据库的数据交换、消息中间件服务器等技术方式。以下给出该数据交换中心节点及企业终端节点的框架结构(如下图所示),并对各模块功能予以说明。(1)数据操作引擎:它是负责接收和发送XML数据的平台。(2)XML解析器:主要是完成XML模式确认的过程,即测试文档是否符合施加到其文档类型之上的约束条件。(3)XML映射器:当企业所用的Schema和交换中心使用的Schema不一致的时候,将用到该功能模块。它首先检查是否有相应的XSLT(可扩展样式表语言)文件,如果有,则直接按该文件的规则把企业的XML转换为标准格式的XML文件;如果没有,则从企业用的Schema中提取出对应的数据格式和数据类型以及字段名,根据业务规则把标准Schema中对应的数据格式、数据类型以及字段名一一映射,系统将按此生成一个XSLT文件并用此文件进行映射。(4)XML-based转换器:主要完成XML数据模式与其它相应数据模式(关系模式、HTML文档、文本文件等)的转换。(5)XML-based封装器:把经过处理后得到的数据按一定的规则转化为XML文件,并将该XML采用SOAP格式进行封装。(6)数据处理器:直接与数据库及其他信息系统进行交互。3.3框架特点(1)安全性:该框架采用星型拓扑结构,便于对数据集中管理,实施时可以在数据交换中心制定一套统一的安全管理策略。数据交换发生在这个中心节点上,该节点接收来自各个企业的数据,解析接收到的数据并按数据交换目的地所识别的格式进行