预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共58页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

课程安排数据仓库:18学时数据挖掘:18学时考试:撰写论文第一章:数据仓库的基本概念与分析型应用结合时存在的问题: 决策支持系统为掌握充分的信息,需要访问大量的企业内部数据和外部数据。 传统数据库中的大量数据是事务型数据,即该数据是对每一项工作、管理对象的具体的、细节性的描述。 事务处理型应用与分析决策型应用对数据库系统的性能要求不同。 传统数据库中保存和管理的一般是当前数据,而决策支持系统不仅需要当前的数据,而且还要求有大量的历史数据。结论: 在事务处理型应用环境中直接构建分析决策型应用是不可行的。 于是: 面向分析决策型应用而组织和存储数据的数据仓库技术应运而生。时间:20世纪80年代初 人物:W.H.Inmon 定义:数据仓库是面向主题的、集成的、具有时间特征的、稳定的数据集合,用以支持经营管理中的决策制定过程。 Adatawarehouseisasubject-oriented,integrated,time-variant,andnonvolatilecollectionofdatainsupportofmanagement’sdecisionmakingprocess. 数据仓库的四大特征: 数据是面向主题的 数据是集成的 数据是具有时间特征的 数据是相对稳定的 数据仓库的其它特点: 数据量非常大(10GB---1000GB) 是数据库技术的一种新的应用 使用人员较少续上表:1-3数据仓库技术的术语 主题:(Subject) 主题是一个在较高层次上将数据归类的标准,每一个主题基本对应一个宏观的分析领域。 例:面向主题:产品订货分析,货物发运分析,新产品开发分析; 面向应用:财务,销售,供应,人力资源,生产调度……. 主题域的特征:独立性,完备性粒度:(Granularity) 粒度是指数据仓库中数据单元的详细程度和级别。 数据越详细,粒度越小,级别越低,回答查询的种类就越多。(数据堆积,回答综合问题效率低) 数据越综合,粒度越大,级别越高,回答查询的种类就越少。维度:(Dimension) 维度是指人们观察事物的角度。 例如:当人们关注产品销售情况时,有如下维度: 时间维:随时间变化的销售数据; 地区维:不同地区的销售数据; 客户维:不同客户的销售; …… 根据观察事物角度的细节程度不同,维又具有维层次。数据; 渠道维:不同销售渠道的销售数据; 产品维:不同产品的销售数据 例:时间维:日期、周、月份、季度、年等; 地区维:城市、地区、国家等。数据立方体: 数据立方体是指由两个或更多个属性即两个或更多个维来描述或者分类的数据。 在三维的情况下可以用图形来表示,一般称为数据立方体。 实际的数据仓库的应用中,数据是多维的。联机分析处理:(OLAP) 联机分析处理是快速、灵活的多维数据分析工具。 OLAP的目的是支持分析决策,满足多维环境的查询和报表需求。 数据仓库的多维数据存储结构为OLAP的实施提供了理想的多维数据环境。数据集市:(DataMart) 数据集市是完整的数据仓库的一个逻辑子集,而数据仓库正是由其所有的数据集市有机组合而成的。 一般在某个业务部门建立数据集市,或称为部门级数据仓库。 建立数据集市与数据仓库,一般是采用“自顶向下”和“自下而上”相结合的设计思想。第一章数据仓库的基本概念1-4多维数据模型 多维数据模型是进行决策支持数据建模的最好方式,数据仓库采用多维数据模型不仅能使其使用方便,而且能提高系统的性能。 1-4-1实体关系模型与多维模型 实体关系模型应用于操作型数据库系统,多维模型应用于分析型数据仓库系统。 实体关系模型不适用于以查询为主的分析型应用,具体表现在:使用者、界面、检索手段。多维数据模型以直观的方式组织数据,每一个多维数据模型由多个多维数据模式(DimensionalDataSchema)表示。 每一个多维数据模式都是由一个事实表(FactTable)和一组维表(DimensionTable)组成。 事实表的主码是组合码,维表的主码是简单码,每一张维表中的简单码与事实表组合码中的一个组成部分相对应。 企业销售数据的多维数据模式图多维数据模型的优势: 多维数据模型是已知标准化的结构,即包含多个多维数据模式,每一个多维数据模式都对应一张事实表和多张维表。 这种多维结构能支持最终用户不可预知的操作,原因在于多维数据模型的各个维是逻辑等价的。 多维数据模型对决策分析有好的扩展性。 汇总数据的巨大价值。 1-4-2星型模式 星型模式是事实表与维表通过星型方式连接而成,如下图: 第一章数据仓库的基本概念第一章数据仓库的基本概念第一章数据仓库的基本概念第一章数据仓库的基本概念第一章数据仓库的基本概念第一章数据仓库的基本概念第一章数据仓库的基本概念第一章数据仓库的基本概念1-5数据仓库的体系结构 1-