Apache Hadoop是大数据分布式处理框架,主要由以下组件组成:
Hadoop Common
HDFS
Hadoop YARN:job调度框架,用于集群资源管理
Hadoop MapReduce
Hadoop提供可靠的共享存户和分析系统,通过HDFS实现数据存储,通过MapReduce进行数据分析和处理。