开发者社区 问答 正文

Hadoop生态圈重点组件是什么?

Hadoop生态圈重点组件是什么?

展开
收起
游客yzrzs5mf6j7yy 2021-12-06 08:42:51 387 分享 版权
1 条回答
写回答
取消 提交回答
  • HDFS:Hadoop的分布式文件存储系统。

    MapReduce:Hadoop的分布式程序运算框架,也可以叫做一种编程模型。

    Hive:基于Hadoop的类SQL数据仓库工具

    Hbase:基于Hadoop的列式分布式NoSQL数据库

    ZooKeeper:分布式协调服务组件

    Mahout:基于MapReduce/Flink/Spark等分布式运算框架的机器学习算法库

    Oozie/Azkaban:工作流调度引擎

    Sqoop:数据迁入迁出工具

    Flume:日志采集工具

    2021-12-06 09:29:54
    赞同 展开评论