预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

大数据平台分析报告1什么是大数据。云中大数据。融合技术如今大数据分析和云计算是全球企业最为关注的两大it话题大数据分析提供独具价值的洞察帮助企业打造竞争优势启迪创新推动收益增长。作为it服务的交付模式云计算可以增强业务灵活性提高生产力同时增加效率降低成本。2大数据能给我们带来什么。中国社会的急剧发展带来了数据的暴增从街头的交通摄像头到商场的打折信息再到网商的用户资料、信息无不充斥着大量的数据而在这背后如何找出有用数据如何发现规律如何找到新的商业机会。大数据究竟能给我们带来什么。信息时代的特征之一就是数据的密集爆发而这种数据的变化没有一个循序渐进的过程呈现跨越式的特征。比如手机里的信息不断地堆积从最开始的通讯录到短信、彩信再发展到现在的智能手机时代更多的来自于应用的数据如微博等正在积累起大量的数据信息。放大到社会而言产生的数据更是异常庞杂。毫无疑问大数据时代已经来了。什么是大数据。数据已从tb级别跃升至pb级别;对大数据现在比较流行的是用4个“v”来总结其四个层面的含义:容量巨大(volume)数据类型多(variety)从普通的文字、视频、图片到逐渐增多的地理位置信息等类型纷繁已无规律可循;价值密度低(value)以视频为例在连续不间断监控过程中可能有用的数据也许只有一两秒;处理速度快(velocity)实时分析对某些应用才更有意义而不是批量式分析即时处理已经成为趋势之一。大数据的发展趋势和带来的机会在大数据概念出来之前个人制造的数据往往被忽略企业数据被谈及的更多。企业内部的数据多数都是结构性数据并被企业在或多或少地利用着无论是数据挖掘还是商业智能化应用都已经初露端倪。面对这些应用需求企业依托自身的数据库系统就可以解决例如应用少量x86服务器、客户端再加上sybase系统、oracle系统、unix系统等。随着互联网的快速发展在企业数据还没有井喷的时候我们就发现个人用户以及社会应用产生的数据已经开始爆发了比如社交、交互式应用带来了大量的网络数据这种非对称性数据充斥在我们周围包括网络日志、点击流、电话记录、医疗记录、传感器和监控摄像头等等各种来源的巨量数据种类丰富让人无所适从。此时传统的硬件设备开始显得捉襟见肘无法满足这种庞杂数据带来的应用需求。很多时候也许我们会认为这些数据里会有价值但是却不知道如何挖掘这些数据的内在价值数据成为了堆砌。因此对于数据精准分析的需求正在呼唤做数据分析的厂商们拿出下一步的举动。比如说在淘宝庞大的用户群中淘宝卖家如何精准掌握一个新用户的需求。一家饭馆如何利用细节满足每一个食客对于美味的需求。越来越多的应用需求推动着大数据的发展。更主要的是未来可能各种传感器会出现在社会的各个地方数据会更多比如交通、医疗等等数据的采集已经不是问题难点已经转换为处理和分析。如此巨量的数据处理难度可想而知。大数据给中国市场带来什么。大数据应用需求在中国更加明显。中国人口众多各行各业都呈现出极快的增长速度电商、快递、微博、社交等都承载了大量的个人信息;大型超市、卖场、商场、银行等集聚了大量交易信息日新月异的城市建设中连接着更多数据采集传感器和嵌入式设备的物联网开始成型……大数据的时代正在到来不仅有机遇也存在挑战且机遇大于挑战。目前网络搜索曾经在数据分析方面获得了一些机会但远远不够而且也是在相对偏窄的一个区域内利用信息更多的数据散落在社会各个环节中梳理分析出这些大数据带来的商业机会逐渐凸显价值。在中国市场工信部发布的物联网“十二五”规划上把信息处理技术作为4项关键技术创新工程之一提出来其中包括了海量数据存储、数据挖掘、图像视频智能分析这都是大数据的重要组成部分。而另外3项关键技术创新工程包括信息感知技术、信息传输技术、信息安全技术也都与大数据密切相关。大数据背后的商业机会在实现大数据的过程中硬件和软件供应商都可以找到合适的位置和方法来实现自身的价值因为大数据的实现需要硬件具备足够的性能、灵活性以及可靠性和软件层面的优化支持。从目前的企业计算领域来看ia架构是承载和实现大数据的理想平台。对于数据分析来说基于英特尔至强处理器的双路/多路平台具备开放式、普及性、易优化、灵活易扩展等特点是实现大数据应用的出色载体。英特尔的双路至强处理器已经通过实践验证了自身在计算能力的领先性而以其为基础的主流服务器和存储系统具备无可比拟的扩展性。对于商业智能来说基于英特尔至强处理器的多路平台则具备高性能、高能效、灵活扩展以及高性价比等优势。此外英特尔还拥有类似于英特尔发行版hadoop这样的开源分布式架构以及相关的软件工具如编译器、函数库等英特尔已经形成了完