1. Hadoop概述
1.1. Hadoop优点
- 高可靠:维护多个数据副本,即使Hadoop某个计算元素或存储出现故障也不会导致数据流失
- 高扩展:在集群分配任务数据,可方便地扩展节点
- 高效:在MapReduce的思想下,Hadoop是并行工作的,加快任务处理速度
- 高容错:自动将失败的任务重新分配
1.2. 组件组成
- MapReduce(计算)
- Yarn(资源调度)
- HDFS(数据存储)
- Common(辅助工具)
1.3. HDFS架构概述
概述:Hadoop Distributed File System分布式文件系统,内置三种组件()