Kettle的四大不同环境工具

简介:

kettle里有不同工具,分别用于ETL的不同阶段。  

  初学者,建议送Spoon开始。高手,是四大工具都会用。

 

 

 

 

  Sqoop: 图形界面工具,快速设计和维护复杂的ETL工作流。集成开发环境,提供了一个图形用户界面,用于创建/编辑作业和转换。Sqoon也额可以用于执行/调试作业或转换,它也有性能监控的功能。

  Kitchen: 运行作业的命令行工具。作业的命令行运行程序,可以通过Shell脚本来使用。Shell脚本一般通过调度程序,如cron或Windows计划任务,来调度执行。

  Pan : 运行转换的命令行工具,和Kitchen一样通过Shell脚本来使用。执行转换而不是作业。

  Carte: 轻量级的(大概1MB)Web服务器,用来远程执行转换或作业。一个运行有Carte进程的机器可以作为从服务器,从服务器是kettle集群的一部分。

 

  

 

 

 

  我这里是以Windows下安装kettle为例。

  是安装在D:\SoftWare\kettle\data-integration下

 

 

 



本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/6907878.html,如需转载请自行联系原作者

相关文章
|
存储 SQL 消息中间件
大数据生态圈常用组件(一):数据库、查询引擎、ETL工具、调度工具等
大数据生态圈常用组件(一):数据库、查询引擎、ETL工具、调度工具等
|
12月前
|
数据采集 存储 安全
「集成架构」ETL工具大比拼:Talend vs Pentaho
「集成架构」ETL工具大比拼:Talend vs Pentaho
|
6月前
|
存储 机器学习/深度学习 数据挖掘
时序数据库 TDengine 与高级分析软件 Seeq 集成,来看看操作手册
通过 TDengine Java connector,Seeq 可以轻松支持查询 TDengine 提供的时序数据,并提供数据展现、分析、预测等功能。本文将对此进行介绍。
276 2
|
11月前
|
XML JSON 大数据
大数据ETL开发之图解Kettle工具
大数据ETL开发之图解Kettle工具
161 0
|
12月前
|
SQL 分布式计算 Oracle
「集成架构」2020年最好的15个ETL工具(第一部)
「集成架构」2020年最好的15个ETL工具(第一部)
|
12月前
|
SQL Oracle 关系型数据库
「集成架构」2020年最好的15个ETL工具(第二部)
「集成架构」2020年最好的15个ETL工具(第二部)
|
12月前
|
存储 大数据 Linux
大数据基本开发工具的源码控制工具的SVN
在大数据开发过程中,源码控制工具是必不可少的。SVN是一种流行的开源版本控制系统,它可以帮助开发者管理和跟踪代码变更。本文将介绍SVN的特点、安装和使用方法。
62 0
|
数据采集 缓存 分布式计算
大数据 ETL 处理工具 Kettle 的核心概念
上一篇中对 Kettle 进行了简单的介绍,并快速体验了一把 Kettle,完成了「把数据从 CSV 文件复制到 Excel 文件」 HelloWrold 级别的功能。 而在实际工作中,可以使用 Kettle 的图形化的方式定义复杂的 ETL 程序和工作流,如下图就是通过一系列的转换(Transformation) 完成一个作业(Job)流程。
|
SQL XML JSON
大数据ETL开发之图解Kettle工具(入门到精通)
ETL (Extract-Transform-Load 的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种ETL工具的使用,必不可少。
4701 0
大数据ETL开发之图解Kettle工具(入门到精通)
Hadoop大数据平台环境搭建注意事项,波若分布式数据采集工具功能剖析,数道云
Hadoop大数据作为时代发展的产物,影响着互联网企业发展、以及企业关于品牌形象推广、政府有关民意采集、以及有关数据信息收集分类……………… Hadoop技术的发展,带来了海量数据高效处理的能力,也给互联网政企、高校的发展带来了突破性的发展。
954 0