Hadoop - 分布式系统基础架构


Apache
跨平台
Java

软件简介

Hadoop
是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop
Distributed File
System),简称HDFS。HDFS有着高容错性的特点,并且设计用来部署在低廉的(low-
cost)硬件上。而且它提供高传输率(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data
set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以流的形式访问(streaming
access)文件系统中的数据。

下图是Hadoop的体系结构: