各种相关开源系统简介

简介:   如下是Apache基金支持的开源软件  hdfs  跟GFS类似, 一个分布式文件系统。  mapreduce  跟Google的MapReduce类似, 一个典型的简单的分布式计算框架。  yarn

  如下是Apache基金支持的开源软件

  hdfs

  跟GFS类似, 一个分布式文件系统。

  mapreduce

  跟Google的MapReduce类似, 一个典型的简单的分布式计算框架。

  yarn

  资源管理系统, 跟Mesos类比。

  Avro

  跟PB类似, 用于将数据结构序列化成字节码, 在不同的语言之间切换。

  官方举例是将C转换给Pig。

  BigTop

  一个给Hadoop打包和测试的软件。其本来是cloudera公司自己给自己写的一个方便OP部署和搭建环境的工具, 不过因为写得不错, 已经成为了Apache顶级项目。目前支持系列Hadoop生态链中的软件: Zookeeper, Flume, HBase, Pig, Hive, Sqoop, Oozie, Whirr, Mahout, SolrCloud, Crunch, DataFu and Hue

  Chukwa

  收集各种实时监控数据(比如日志)并固化到HDFS上的事情。

  Drill

  Google的Dremel的开源版本。PB以上数据实时秒级查询。

  Flume

  用来做数据迁移的工具。支持数据包括Avro, files, 系统日志, 落地的系统包括HDFS, HBase。

  HBase

  Google的BigTable的开源版本。宽列存储, 底层基于HDFS。

  HCatalog

  为HDFS做的一个管理metadata的系统。基于Hive, 提供服务给MapReduce, Pig, 将来会支HBase。

  Hive

  支持HSQL, 将SQL转换成MapReduce任务。

  Mahout

  一个数据挖掘, 机器分析的算法库。

  Oozie

  用来管理Hadoop中的多轮任务的工具, 类似DAG管理工具。

  Tez

  也是多个任务的DAG管理工具, 但是其做得更底层,直接替代了买二手手游账号MR的调度程序,多个任务之间的数据传递不用再落地到hdfs上了。

  Pig

  跟Hive类似, 提供比裸写MR更友好的界面, 然后翻译成MapReduce。只是Hive提供的是SQL, Pig提供的是更高级别的语言Pig-Latin, 供用户做数据挖掘和分析。

  Sqoop

  Sql-to-Hadoop。将关系型数据库中的数据导入到Hadoop当中。

  ZooKeeper

  提供高可用的存储服务。内部采用paxos一致性协议。

  Whirr

  用于将Hadoop放到各种IaaS里面去运行的环境部署类项目。

  Crunch

  用来管理Hadoop/Spark上面的Pipeline的软件。应该是比Pig/Hive更低一个级别的抽象, 提供数据的join/aggregation的Java API。

  DataFu

  为Pig而准备的系列数据挖掘算法软件包。

  Hue

  Hadoop的漂亮平台化界面。

  如下是非Apache组织的一些项目

  Spark

  支持迭代式计算。将MapReduce的一轮一轮计算的概念转换成同一批数据不停处理的概念, 并提供高级语言。

  Shark

  Hive On Spark。即支持HSQL。

  Impala(Cloudera)

  另一个Google的Dremel的开源版本, 界面跟Hive类似(事实上就是使用的Hive-SQL的子集), 只是不是翻译成MapReduce而是直接查询。

  Sentry(Cloudera)

  在Hive/Impala之上独立的一层专门做认证授权的系统。

  SolrCloud

  Solr+Hadoop, Big Data Search。

  参考

  Hadoop Software Ecosystem. revelytix/?q=content/hadoop-ecosystemAvro in 3 minutes. youtube/watch?v=3BOkW1iVQOQOLAP技术产品组成. maxatx/olap/index.htm感谢各位支持,点击屏幕右上角的【关注】每天文章不落下。感激不尽!

  本头条号文章分类目录(精心整理)

相关实践学习
云数据库HBase版使用教程
  相关的阿里云产品:云数据库 HBase 版 面向大数据领域的一站式NoSQL服务,100%兼容开源HBase并深度扩展,支持海量数据下的实时存储、高并发吞吐、轻SQL分析、全文检索、时序时空查询等能力,是风控、推荐、广告、物联网、车联网、Feeds流、数据大屏等场景首选数据库,是为淘宝、支付宝、菜鸟等众多阿里核心业务提供关键支撑的数据库。 了解产品详情: https://cn.aliyun.com/product/hbase   ------------------------------------------------------------------------- 阿里云数据库体验:数据库上云实战 开发者云会免费提供一台带自建MySQL的源数据库 ECS 实例和一台目标数据库 RDS实例。跟着指引,您可以一步步实现将ECS自建数据库迁移到目标数据库RDS。 点击下方链接,领取免费ECS&RDS资源,30分钟完成数据库上云实战!https://developer.aliyun.com/adc/scenario/51eefbd1894e42f6bb9acacadd3f9121?spm=a2c6h.13788135.J_3257954370.9.4ba85f24utseFl
目录
相关文章
|
3天前
|
网络协议 数据处理 数据安全/隐私保护
|
24天前
|
SQL 前端开发 程序员
拥抱开源,构建未来:王嘉树与 TDengine 的开源之旅
在当代的技术浪潮中,开源文化不仅催生了无数创新技术,也为广大技术爱好者提供了一个展示才华、相互学习的平台。我们今天采访到的这位北京邮电大学电子工程学院的研究生,就是在这样的背景下,通过开源活动不断探索、学习并实现自我突破的典型代表,他就是王嘉树。
20 0
|
2月前
|
存储 JavaScript 前端开发
Wikijs 简介 - 强大 & 可扩展的开源维基软件
Wikijs 简介 - 强大 & 可扩展的开源维基软件
|
存储 SQL 缓存
开源 PolarDBPG 架构介绍 | 学习笔记
快速学习开源 PolarDBPG 架构介绍
667 0
开源 PolarDBPG 架构介绍 | 学习笔记
|
存储 监控 前端开发
APM开源方案-SigNoz初体验
最近在调研APM相关的开源方案,发现ATA上这类的文章比较少,准备搞一系列APM的“初体验”文章,那么先从最近github势头较热的SigNoz开始SigNoz简介SigNoz是一套开源APM方案,用于监控应用指标和链路,可以看到调用情况、异常、trace上下链路,也可以自己定义Dashboard。官方对于SigNoz介绍很全面了,不赘述啦。值得注意的是,SigNoz支持OpenTelemetry
5845 2
APM开源方案-SigNoz初体验
|
供应链 监控 小程序
基于 netcore 开源管理平台
DM 是一个完全开源的项目,源代码全部托管在 Gitee 上,项目源码和核心插件源码放在 ​ ​https://gitee.com/xiaomagenb/dlvm​​
111 0
基于 netcore 开源管理平台
|
供应链 监控 小程序
DLVM 开源平台管理框架
介绍 DM 是一个完全开源的项目,源代码全部托管在 Gitee 上,项目源码和核心插件源码放在 https://gitee.com/xiaomagenb/dlvm
180 0
DLVM 开源平台管理框架
|
SQL 消息中间件 存储
搭建大数据运行环境之二(4)
搭建大数据运行环境之二(4)
156 0
搭建大数据运行环境之二(4)
|
存储 大数据 关系型数据库
搭建大数据运行环境之二(3)
搭建大数据运行环境之二(3)
搭建大数据运行环境之二(3)
|
分布式计算 大数据 Hadoop
搭建大数据运行环境之二(2)
搭建大数据运行环境之二(2)
135 0
搭建大数据运行环境之二(2)

热门文章

最新文章

  • 1
    流量控制系统,用正则表达式提取汉字
    27
  • 2
    Redis09-----List类型,有序,元素可以重复,插入和删除快,查询速度一般,一般保存一些有顺序的数据,如朋友圈点赞列表,评论列表等,LPUSH user 1 2 3可以一个一个推
    27
  • 3
    Redis08命令-Hash类型,也叫散列,其中value是一个无序字典,类似于java的HashMap结构,Hash结构可以将对象中的每个字段独立存储,可以针对每字段做CRUD
    27
  • 4
    Redis07命令-String类型字符串,不管是哪种格式,底层都是字节数组形式存储的,最大空间不超过512m,SET添加,MSET批量添加,INCRBY age 2可以,MSET,INCRSETEX
    28
  • 5
    S外部函数可以访问函数内部的变量的闭包-闭包最简单的用不了,闭包是内层函数+外层函数的变量,简称为函数套函数,外部函数可以访问函数内部的变量,存在函数套函数
    25
  • 6
    Redis06-Redis常用的命令,模糊的搜索查询往往会对服务器产生很大的压力,MSET k1 v1 k2 v2 k3 v3 添加,DEL是删除的意思,EXISTS age 可以用来查询是否有存在1
    31
  • 7
    Redis05数据结构介绍,数据结构介绍,官方网站中看到
    22
  • 8
    JS字符串数据类型转换,字符串如何转成变量,+号只要有一个是字符串,就会把另外一个转成字符串,- * / 都会把数据转成数字类型,数字型控制台是蓝色,字符型控制台是黑色,
    20
  • 9
    JS数组操作---删除,arr.pop()方法从数组中删除最后一个元素,并返回该元素的值,arr.shift() 删除第一个值,arr.splice()方法,删除指定元素,arr.splice,从第一
    21
  • 10
    定义好变量,${age}模版字符串,对象可以放null,检验数据类型console.log(typeof str)
    20