预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

开源BI平台Openi的开发数据仓库系统现在大家比较公认的商业智能系统分为报表、OLAP、数据仓库、数据挖掘和即席查询五大块本身商业智能系统也只是一个比较新的概念也许随着技术和应用的发展还会扩充出来很多模块。本文就基于开源BI平台Openi的数据仓库系统进行整体设计及开发就其中比较热门的技术如OLAP、数据仓库等进行初步的讲解以期起到一个抛砖引玉的作用。一、开源的BI平台商业智能也称作BI是英文单词BusinessIntelligence的缩写。商业智能通常被理解为将企业中现有的数据转化为知识帮助企业做出明智的业务经营决策的工具。这里所谈的数据包括来自企业业务系统的订单、库存、交易账目、客户和供应商等来自企业所处行业和竞争对手的数据以及来自企业所处的其他外部环境中的各种数据。而商业智能能够辅助的业务经营决策既可以是操作层的也可以是战术层和战略层的决策。为了将数据转化为知识需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。因此从技术层面上讲商业智能不是什么新技术它只是数据仓库、OLAP和数据挖掘等技术的综合运用。从国内企业和政府部门的信息化建设发展来看从最初的各类MIS系统到近几年流行的ERP、CRM等用户的数据积累已达到了一定的程度很多行业的用户面对越来越激烈的市场竞争他们需要对自己的数据(用户、市场、产品)进行分析挖掘出潜在的商机降低公司的运作成本这是BI和数据仓库类产品被市场看好、不断获得增长的根本原因!在现有的市场中对于BI类产品来说往往是与数据仓库整体解决方案相关联一些国内的IT公司也正在把BI和数据仓库的结合作为行业的解决方案来推广到自己熟悉的领域。对于IT公司来说在ERP、CRM之后需要寻找新的利润增长点BI和数据仓库的出现无疑是一个莫大的商机。在商业智能系统出现之前大家都是通过报表来展现数据库中的数据报表有简单有复杂当然报表只能静态的展现一部分数据用户只能看到已经做好的报表不能根据自己的需要重新构造报表。随着技术的发展出现了OLAP分析它能够让用户根据自己的想法对数据进行聚类、分类、钻取等操作这样就很好的解决了报表不能动态展现的问题。之后随着数据仓库和数据挖掘技术的不断完善大家都认为商业智能系统主要是分析数据就把OLAP、数据仓库和数据挖掘归类到一起形成了BI系统这三项确实能够体现Intelligence的概念。因此初期的BI系统都是只含有这三块但是用户在使用一段时间后认为报表模块是必不可少的因此都纷纷要求BI供应商将报表模块加进来为什么会出现这种情况呢?因为虽然OLAP能动态展现数据但是它主要还是侧重于决策者的分析而中层领导更喜欢看到的是报表他们需要掌握自己所分管部分的运营情况报表则是最好的展现数据的方式因此最后各BI厂商就将报表也加入到BI系统中去了例如BO收购水晶报表Hyperion收购Brio等都是BI厂商收购报表厂商来完善自己的报表功能。下面列出相对成熟和完整并且有借鉴意义的开源BI套件而本文中的仓库系统的设计及开发采用就是其中的Openi这种开源的BI平台。(1)、Bizgres为GreenPlum公司主导的开源项目和Sun公司达成合作关系。Bizgres为BI应用而对PostgreSQL做了优化提高了大负荷的并行计算能力在BI环境中相对于普通的关系型数据库具有卓越的数据处理性能。Bizgres的数据库平台可以和KETL和JasperReports进行整合从而形成一个BI套件。(2)、Openi是一个Java开发的Web应用能对OLAP服务器、关系数据库和数据挖掘服务器进行分析和报表展示非常易于使用和部署界面美观友好后续还将支持数据挖掘和ETL等。(3)、Pentaho是一个以工作流为核心的、强调面向解决方案而非工具组件的BI套件整合了多个开源项目目标是和商业BI相抗衡。它包括。由上可见Pentaho是一个很完善的BI解决方案。Pentaho偏向于与业务流程相结合的BI解决方案侧重于大中型企业应用。(4)、SpagoBISpagoBI集成了Mondrain和JProvit能够通过OpenLaszlo产生实时报表。SpagoBI使用java开发不依赖于具体的操作系统有很强的扩展能力。根据其Roadmap可以看出SpagoBI将融入更多的BI功能甚至BI之外的功能。1二、系统设计1.系统体系结构该系统基与多层体系结构设计其中包括:WEB客户端层;WEB服务器层;数据持久层。系统多层体系结构图2.系统数据流程下面我们来介绍一下数据仓库系统的数据流程以此来让用户更好的把握产品的整体架构和功能原理。下图为系统的数据流程与相关功能关系图。数据仓库系统的数据流程从上面的图中我们可以看到数据仓库系统系统数据有两类:业务数据和多维数据。业务数据由业务系统产生