Hadoop分布式文件系统-架构和设计要点(翻译).doc
qw****27
亲,该文档总共338页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
Hadoop分布式文件系统-架构和设计要点(翻译).doc
Hadoop分布式文件系统:架构和设计要点(翻译)一、前提和设计目标1、硬件错误是常态,而非异常情况,HDFS可能是有成百上千的server组成,任何一个组件都有可能一直失效,因此错误检测和快速、自动的恢复是HDFS的核心架构目标。2、跑在HDFS上的应用与一般的应用不同,它们主要是以流式读为主,做批量处理;比之关注数据访问的低延迟问题,更关键的在于数据访问的高吞吐量。3、HDFS以支持大数据集合为目标,一个存储在上面的典型文件大小一般都在千兆至T字节,一个单一HDFS实例应该能支撑数以千万计的文件。4、
Hadoop分布式文件系统-架构和设计要点(翻译).doc
Hadoop分布式文件系统:架构和设计要点(翻译)一、前提和设计目标1、硬件错误是常态,而非异常情况,HDFS可能是有成百上千的server组成,任何一个组件都有可能一直失效,因此错误检测和快速、自动的恢复是HDFS的核心架构目标。2、跑在HDFS上的应用与一般的应用不同,它们主要是以流式读为主,做批量处理;比之关注数据访问的低延迟问题,更关键的在于数据访问的高吞吐量。3、HDFS以支持大数据集合为目标,一个存储在上面的典型文件大小一般都在千兆至T字节,一个单一HDFS实例应该能支撑数以千万计的文件。4、
HADOOP分布式文件系统架构和源码分析报告.pdf
Hadoop分布式文件系统,结构与设计 (中文).pdf
Hadoop分布式文件系统:结构与设计目录1.介绍Hadoop分布式文件系统(HDFS)是一个设计为用在普通硬件设备上的分布式文件系统。它与现有的分布式文件系统有很多近似的地方,但又和这些文件系统有很明显的不同。HDFS是高容错的,设计为部署在廉价硬件上的。HDFS对应用程序的数据提供高吞吐量,而且适用于那些大数据集应用程序。HDFS开放了一些POSIX的必须接口,容许流式访问文件系统的数据。HDFS最初是为了Apache的Nutch网络搜索引擎项目的下层构件而设计的。是Hadoop项目的一部分,而这又是
分布式文件系统架构设计.pdf
分布式文件系统架构设计1目录1.前言......................................................................................................32.HDFS1.................................................................................................33.HDFS2......................