预览加载中,请您耐心等待几秒...
1/8
2/8
3/8
4/8
5/8
6/8
7/8
8/8

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

BI是什么?几年前当我还是商业智能:更快更好地作出决策(微软出版社2002年)的共同作者时我就感到非常惊讶因为我和我的合作伙伴在哪些技术应视为属于BI领域范畴因而应该在那本书中介绍的问题上竟然存在这么大的意见分歧。对于哪些工具是BI工具而哪些工具不是在BI专家之间居然能够听到这么对立的意见这实在是一个非常有启迪意义的经验。在IT行业中这种观点的差异仍然存在许多人还在围绕BI的定义争论不休。对我来说BI是一个既有业务流程特点又有技术特点的概念因此我们便从这个角度开始来定义BI。从业务流程角度来讲BI是您执行的一系列活动目的是为了收集和分析数据以便可以做出更好的决策并通过与其他人共享分析结果来改进您的业务。您是否需要信息以确定如何提高您的日常工作效率或支持长期规划(例如下一年的预算要采取什么步骤来查找、传输、格式化和研究数据等等)这都属于BI的范畴。此外BI还包括要如何在今后参考您的结果这样您和其他人就可以在研究数据后对您所作出的决策的效果进行衡量。通常来说BI是一个反复总结演进的过程。首先您分析数据以了解发生了什么事情接着您采取措施以不断推行好的做法制止不好的做法然后您再次分析数据以确定您的操作效果如何以及外部因素会给您的工作带来什么影响。根据这个宽泛的BI定义即使您只是草草记录信息或者只是创建一个列表以帮助您做出全天的决策都是在使用BI。通过在用于收集、分析和共享信息的部分或全部业务流程中引入技术可以使这些流程更加富有效率。组织在开始时往往是小规模采用BI技术而且通常主要是为了解决特定问题。经过一段时间后组织越来越多地使用BI技术并且其重点也转移到如何在整个组织中有效地传播信息上。随着BI战略的不断成熟组织通常会获得更加复杂的工具以便能够更好地与数据交互和研究数据。查询企业数据库有什么问题?无论在哪个BI定义中数据都始终是焦点。那么您可能想知道如果只需查询一个或多个组织的数据库即可获得所需的数据为什么还要费力创建BI解决方案呢?如果您是正在收集的数据的唯一使用者如果您具有用于访问企业数据库的工具、技能和安全权限并且您需要的所有数据都位于这些数据源中那么您可能不需要正式的BI解决方案。与之相反如果您经常需要与具备不同技能和安全权限的其他人共享信息那么您可能需要创建一个可以简单使用和维护的BI解决方案。您还需要考虑一旦您的同事听到这种方便的BI解决方案他们也可能想要使用它。为了预见这种需求您的解决方案从一开始就应具备可伸缩性。表面上看来让公司中的任何人都可以运行报告以便从企业数据库中获取数据这似乎是一个不错的办法但这种方法可能不会受到数据库管理员的欢迎。因为他们会告诉您直接查询企业数据库可能会带来一些问题。以下是几个常见的问题:如果组织的数据以不同格式存储在不同平台中那么要将这些数据合并为可用于分析的通用格式是非常困难的。数据无法从源表直接复制到公共的目标表中而是需要在存储前执行某些操作。在多个的数据库中数据定义可能不一致而协调看起来相似的数据是非常困难的。例如销售数据库中的收入数据可能是根据一组业务规则计算的但它们可能又受到总帐数据库中的一组完全不同的业务规则的影响。每个数据库都可能针对数据插入或执行查询进行了结构化或优化。即使您只想查询一个数据库但运行分析查询通常需要汇总大量的数据而这将消耗较多的数据库资源。因此您的查询可能需要执行很长时间并且可能会与其他执行插入、更新或查询操作的应用程序产生资源争用。历史数据通常存档而非在企业数据库中无限期地维护。如果您想要查看一段时间内的趋势(这是常见的BI活动)您的解决方案可能需要存储不会持续保存在企业数据库中的数据。一些分析所需的数据可能不在企业数据库中。而可能在平面文件、电子表格或是非结构化数据格式(例如Word文档的格式)中。更大的麻烦在于获取人们存储在其本地计算机或脑海中的信息。即使可以得到数据有时质量问题也意味着您不能直接从数据源中使用数据。您可能需要下载数据并对其进行清理然后才能分析数据。除非可以在数据源中清理数据否则您每次访问数据时都需要手动清理并且还需确保每次都应用相同的规则。此外您无法确保所有其他使用相同数据的人都使用相同的规则来清理它。为了解决这些数据访问的问题BI解决方案通常包括创建一个专门用于容纳待分析数据的数据库。具有这样一个数据库意味着您可以避免生成数据的活动和使用数据的活动之间的任何资源争用。而且您可以重构数据这样汇总数据的查询可以运行得更快。如果您需要合并来自多个数据源的数据您可以集中这些数据然后应用业务逻辑以将数据转换为具有一致意义的通用格式。您还可以将不是来自数据库的数据(例如来