• Apache开源, 分布式系统基础架构
  • 面临问题
    • 硬盘
      • 1块: 10TB-14TB
      • 1PB: 102块硬盘
      • MySQL5.5: 300w-500w
      • MySQL8: 1亿、1GB
  • Doug Cutting
  • 发展
    • 2003-2004: Google公开部分GFS和MapReduce
    • 2005: Hadoop成为Apache Lucene子项目Nutch了一部分
    • 2006.3: MapReduce和NDFS(Nutch Distributed File System)纳入Hadoop
  • 版本
    • Hadoop1.x
      • HDFS(存), MapReduce(算、资源调度), Common
    • Hadoop2.x
      • HDFS(存), MapReduce(算), Yarn(资源调度), Common
    • Hadoop3.x
  • 发行版本
    • Apache: 开源
    • Cloudera: Doug Cutting, 一键部署, 资源占用大
    • Hortonworks: 雅虎工程师,贡献Hadoop 80%代码, 一键部署
    • 阿里云
  • 特点
    • 高可靠性:多副本
    • 高扩展性
    • 高效性: 并行运行
    • 高容错性
  • 发行版
  • 运行平台
  • Hadoop使用
  • Hadoop 组件