一、概述

Hadoop 是一个由 Apache 基金会所开发的分布式系统基础架构,主要解决,海量数据的存储和海量数据的分析计算问题。

hadoop

二、核心组件

Hadoop 的核心组件是 HDFS,MapReduce 以及 YARN。

hadoop

2.1. HDFS

HDFS 是 Hadoop 分布式文件系统,是指提供对应用程序数据的高吞吐量访问的分布式文件系统。

正在持续施工中ing~~~

2.2. Yarn

Yarn 是作业调度和集群资源管理的框架。

正在施工中ing~~~

2.3. MapReduce

Hadoop MapReduce 是用于并行处理大型数据集的软件框架。

正在施工中ing~~~

三、实战

正在施工中ing~~~

四、大厂分享

五、参考

5.1. 书籍

  1. Hadoop 2.X HDFS 源码剖析

    Hadoop 2.X HDFS源码剖析