预览加载中,请您耐心等待几秒...
1/4
2/4
3/4
4/4

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

什么是数据仓库_优缺点有哪些_随着信息时代的到来企业越来越意识到数据质量对企业的发展的重要程度,数据仓库不仅能很好的治理海量数据,还能通过数据挖掘提取数据价值,提升企业的竞争力,越来越受企业重视。那么,什么是数据仓库?有哪些优缺点?本文将具体介绍。1.数据仓库《BuildingtheDataWarehouse》一书的作者W.H.Inmon最先给数据仓库下了定义,即是面向主题的、集成的、相对稳定的、反映历史变化的数据集合。让管理层可以洞察数据趋势、行业动向,进而驱动业务发展。面向主题:指用户在对数据进行统计分析时关注的维度。一般根据维度来定义主题,从多个业务线抽取出共同的维度建立主题。集成的:数据仓库中的数据是从业务数据库中通过抽取数据并处理、总结和规划后进行提取和过滤导入的。并要处理杂乱的和分散在不同业务系统的问题,因此可以确保数据仓库中的数据具有全局统一的特性。相对稳定的:数据从业务系统导入到数据仓库后,被长久的存储起来,主要进行查询操作而不进行修改和更新。通常只是定期的导入数据。反映历史变化:数据仓库不断从业务系统中收集数据,积累的数据则蕴藏所有历史累计信息,通过分析历史累计的数据对企业的发展方向和行业的发展趋势做出精准的分析和预测。目前,几乎所有的电商数据仓库都建设在Hadoop大数据技术生态之上。数据仓库包含以下四个模块:数据源、数据存储与管理、OLAP服务器(On-LineAnalysisProcessing,联机分析处理)和前端工具与应用。2.数据仓库优缺点(1)数据仓库的优点1)非易失性存储在数据仓库中的数据是非易失性的,因为存储在数据仓库中的信息无法编辑。一旦将信息插入到数据仓库中,就只能对其进行更新或完全删除。2)时变性存储在数据仓库中的信息无法编辑,因此可以在数据仓库中长期存储。如果一个组织想要评估为什么销售额在过去一年中下降,而在两年前的销售额却是不可计数的,这可以通过参考存储在数据库中的信息来参考其当时使用的策略。3)结构化信息存储以结构化方式存储的信息。这意味着这里存储的数据是根据其来源划分的,并存储在各自的数据集市中。如果有数据必须添加到销售中,则该信息将进入已在数据仓库中创建的销售数据集市。数据仓库中没有杂乱的数据输入。4)集成数据数据集成是数据仓库的主要功能之一。数据的集成存储意味着来自多个来源的数据一起存储在数据仓库中。(2)数据仓库的缺点1)无法存储大量数据无法存储大量数据被认为是数据仓库的主要缺点之一。这导致了大数据没有数据仓库的支持。2)数据是刚性的由于信息以指定的文件格式存储,因此要在数据仓库中使用数据,必须将其更改为该文件格式。这导致了数据仓库无法存储混合文件格式的数据的缺点。3)维护成本高每当小型组织获得大型IT项目时,就需要高维护系统。这些高维护系统需要财政资源。这会导致组织花费更多的资源而不是从中获利。: