预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共45页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

5.东软基于HADOOP的大数据应用建议IDC定义:为了更为经济的从高频率获取的、大容量的、不同结构和类型的数据中获取价值,而设计的新一代架构和技术。大数据对系统的需求商业模式驱动大数据市场分析5.东软基于HADOOP的大数据应用建议大数据主要应用技术——HadoopMapReduceHDFS——分布式文件系统HDFS具体操作MapReduce——映射、化简编程模型HBASE——分布式数据存储5.东软基于HADOOP的大数据应用建议Hadoop主要开发厂商Hadoop主要开发厂商——CLOUDERAHadoop主要开发厂商——HortonworksInfoSphereBigInsights是一个软件平台,旨在帮助企业从大量不同范围的数据中挖掘商机并进行分析,如日志记录、点击流、社会媒体数据、新闻摘要、电子传感器输出,甚至是一些事务数据等。BigInsights包括ApacheHadoop发行版、面向MapReduce编程的Pig编程语言、针对IBM的DB2数据库的连接件以及IBMBigSheets。 IBM通过其智慧云企业(SmartCloudEnterprise)基础架构,将BigInsights和BigSheets作为一项服务来提供。客户不必购买支持性硬件,也不需要IT专门知识,就可以学习和试用大数据处理和分析功能。据IBM称,客户用30分钟就能搭建起Hadoop集群,并能将现有数据转移到集群里面。 Hadoop主要开发厂商——ORACLEEMC公司于2013年发布了自身的ApacheHadoop发行版——PivotalHD,同时发布的还有一个名为HAWQ的技术,通过HAWQ能够将Greenplum分析型数据库与Hadoop分布式架构进行紧密地融合。PivotalHD对ApacheHadoop进行了全面的改造,同其他一些Hadoop发行版相比,其最大的优势就是能够与Greenplum数据库进行整合,PivotalHD和HAWQ让EMC在Hadoop领域更进一步,同时将成为EMC大数据战略中的一个重要里程碑。 基于在大数据领域的长期技术积累和应用经验,英特尔推出成熟的企业级Hadoop发行版,为企业和政府部门实现大数据应用提供强有力的平台支持。英特尔在Hadoop上的改进和功能增强为用户提供了一个高性能、高稳定性和可管理的大数据应用实施平台,并提供全面的专业支持。在Hadoop软件的英特尔分发版在中国推广的两年多时间里,已经在电信行业、智能交通行业有多个成功应用。5.东软基于HADOOP的大数据应用建议大数据应用行业分析网络终端设备公司大数据行业应用分析——金融行业金融行业大数据发展分析摩根大通基于Hadoop的大数据应用32中国移动基于Hadoop的大数据应用 中国联通已经构建了一个全国集中的一级架构海量数据存储和查询系统:通信用户上网记录集中查询与分析支撑系统,在集团公司进行统一部署,各个省分仅仅是做数据的采集,按照业务实时性将数据传送到集团公司,由集团公司统一处理,全国所有用户所有上网记录数据都放北京数据中心里,在国内电信行业当中也是首创的方式。 中国联通成功将大数据和Hadoop技术引入到‘移动通信用户上网记录集中查询与分析支撑系统’。截止到目前已经部署了4.5PB的存储空间。其中,4.5PB的存储分布在300个数据节点上,即每个节点配备15TB的存储空间。系统每天有能力处理700亿条上网记录。政府行业大数据需求分析政府行业大数据应用——智慧城市大数据行业应用分析——医疗行业医疗行业大数据需求分析Cloudera正在与西奈山医学院合作开发新的生物数据分析方法和系统。Cloudera还与FDA合作侦测多种药物组合的副作用,与埃默里大学合作帮助病历学家更准确地分析医疗影像。Cloudera的客户之一——Explorys的业务主要是聚合并分析医疗记录,而英特尔和NextBio则合作使用Hadoop处理基因数据。 Apixio利用Hadoop平台开发了语义分析服务,可以对病人的健康提供医生、护士、及其他相关人士的回答。Apixio试图通过对医疗记录进行先进的技术分析,与一个简单的基于云计算的搜索引擎来帮助医生迅速了解病人相关病史,挽救生命。 大数据行业应用分析——能源行业能源行业大数据需求分析能源行业基于Hadoop的大数据应用