预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

大数据的国内外研究现状与发展动态分析 报告 大数据是指规模巨大、类型多样、处理复杂的数据集合。 在过去,企业主要在大型机上存储财务、银行等关键应用系统 的数据,但是以今天的数据量来看,这些数据是非常有限的。 随着PC的普及和应用增多,企业内部出现了很多以公文档为 主要形式的数据,包括Word、Excel文档,以及后来出现的 图片、图像、影像和音频等。互联网的兴起则促成了数据量的 第三次大规模增长,在互联网的时代,几乎全民都在制造数据。 数据的形式也极其丰富,既有社交网络、多媒体等应用所主动 产生的数据,也有搜索引擎、网页浏览等被动行为过程中被记 录、搜集的数据。时至今日,随着移动互联网、物联网、云计 算应用的进一步丰富,数据已呈指数级的增长,企业所处理的 数据已经达到PB级,而全球每年所产生的数据量更是到了惊 人的ZB级。 在这种背景下,“大数据”的概念逐渐在科技界、学术界、 产业界引起热议。在大数据时代,我们分析的数据因为“大”, 摆脱了传统对随机采样的依赖,而是面对全体数据。因为所有 信息都是“数”,可以不再纠结具体数据的精确度,而是坦然面 对信息的混杂。信息之“大”之“杂”,让我们分析的“据”也由传 统的因果关系变为相关关系。 大数据的意义在于,它可以帮助我们更好地理解和解决各 种问题。通过对数据的分析,我们可以发现规律、预测趋势、 识别异常。在商业领域,大数据可以帮助企业更好地了解市场 需求和客户行为,制定更有效的营销策略。在医疗领域,大数 据可以帮助医生更准确地诊断疾病和制定治疗方案。在政府领 域,大数据可以帮助政府更好地了解社会状况和民生需求,制 定更科学的政策。在科学研究领域,大数据可以帮助科学家更 好地理解自然规律和人类行为,推动科学进步。 总之,大数据是一个非常重要的概念,它正在改变我们的 生活和工作方式。未来,随着技术的不断进步和应用场景的不 断扩展,大数据将会发挥越来越重要的作用。 大数据热潮的兴起为中国提供了“弯道超车”的机会,使得 中国IT企业有机会从在红海领域苦苦挣扎转向在蓝海领域奋 起直追。传统IT行业对于底层设备、基础技术的要求非常高, 企业在起点落后的情况下始终疲于追赶。然而,在大数据时代, 这种一步落后、处处受制于人的状态有望得到改变。大数据对 于硬件基础设施的要求相对较低,不会受困于基础设备核心元 件的相对落后。与在传统数据库操作层面的技术差距相比,大 数据分析应用的中外技术差距要小得多。此外,美国等传统 IT强国的大数据战略也都处于摸着石头过河的试错阶段。中 国市场的规模之大也为这一产业发展提供了大空间、大平台。 大数据对于中国企业来说不仅仅是信息技术的更新,更是 企业发展战略的变革。随着对大数据的获取、处理、管理等各 个角度研究的开展,企业逐渐认识数据已经逐渐演变成“数据 资产”。任何硬件、软件及服务都会随着技术发展和需求变化 逐渐被淘汰,只有数据才具有长期可用性,值得积累。数据是 企业的核心资产,可以是也应该是独立于软硬件系统及应用需 求而存在的。大数据是信息技术演化的最新产物,确立了数据 这一信息技术元素的独立地位。正因为数据不再是软硬件及应 用的附属产物,才有了今天爆炸式的数据增长,从而奠定了大 数据的基础。 需要注意的是,文章中有一些明显的格式错误,需要进行 修改。此外,有些段落表述不够清晰,需要进行小幅度的改写, 以使文章更加易于理解。 大数据”这个概念最早出现在上个世纪80年代,___在 《第三次浪潮》一书中将其称为“第三次浪潮的华彩乐章”。 2008年9月,《科学》杂志发表了一篇文章“BigData:___”, 从此“大数据”一词开始被广泛传播。目前国内外专家学者对大 数据的定义在数据规模上达成共识,即“超大规模”表示GB级 别的数据,“海量”表示TB级别的数据,而“大数据”则是PB 级别及以上的数据。但对其准确定义给出的结论并不一致。 ___(NSF)将大数据定义为“由科学仪器、传感设备、互联网交 易、电子邮件、音视频软件、网络点击流等多种数据源生成的 大规模、多元化、复杂、长期的分布式数据集”。Wiki对大数 据的定义为:所涉及的资料量规模巨大到无法透过目前主流软 件工具,在合理时间内达到撷取、管理、处理、并整理成为帮 助企业经营决策更积极目的的资讯。___全球数据分析研究所 在2011年5月发表的一篇论文中提到:“大数据是指大小超出 了典型数据库工具收集、存储、管理和分析能力的数据集。” 但同时指出“大数据”并非总是数百个TB才算得上,有时候数 百个GB的数据也可被称为大数据,这取决于它的第三个维度。 大数据是指在一个或多个维度上超出传统信息技术的处理