Kettle的四大不同环境工具

简介:

kettle里有不同工具,分别用于ETL的不同阶段。  

  初学者,建议送Spoon开始。高手,是四大工具都会用。

 

 

 

 

  Sqoop: 图形界面工具,快速设计和维护复杂的ETL工作流。集成开发环境,提供了一个图形用户界面,用于创建/编辑作业和转换。Sqoon也额可以用于执行/调试作业或转换,它也有性能监控的功能。

  Kitchen: 运行作业的命令行工具。作业的命令行运行程序,可以通过Shell脚本来使用。Shell脚本一般通过调度程序,如cron或Windows计划任务,来调度执行。

  Pan : 运行转换的命令行工具,和Kitchen一样通过Shell脚本来使用。执行转换而不是作业。

  Carte: 轻量级的(大概1MB)Web服务器,用来远程执行转换或作业。一个运行有Carte进程的机器可以作为从服务器,从服务器是kettle集群的一部分。

 

  

 

 

 

  我这里是以Windows下安装kettle为例。

  是安装在D:\SoftWare\kettle\data-integration下

 

 

 



本文转自大数据躺过的坑博客园博客,原文链接:http://www.cnblogs.com/zlslch/p/6907878.html,如需转载请自行联系原作者

相关文章
|
6月前
|
Dubbo 前端开发 Java
让你在组建企业级项目时手到擒来——浅谈各类常用工具和框架概述
让你在组建企业级项目时手到擒来——浅谈各类常用工具和框架概述
|
存储 SQL 消息中间件
大数据生态圈常用组件(一):数据库、查询引擎、ETL工具、调度工具等
大数据生态圈常用组件(一):数据库、查询引擎、ETL工具、调度工具等
|
数据采集 存储 安全
「集成架构」ETL工具大比拼:Talend vs Pentaho
「集成架构」ETL工具大比拼:Talend vs Pentaho
|
存储 机器学习/深度学习 数据挖掘
时序数据库 TDengine 与高级分析软件 Seeq 集成,来看看操作手册
通过 TDengine Java connector,Seeq 可以轻松支持查询 TDengine 提供的时序数据,并提供数据展现、分析、预测等功能。本文将对此进行介绍。
355 2
|
SQL 分布式计算 Oracle
「集成架构」2020年最好的15个ETL工具(第一部)
「集成架构」2020年最好的15个ETL工具(第一部)
|
存储 大数据 Linux
大数据基本开发工具的源码控制工具的SVN
在大数据开发过程中,源码控制工具是必不可少的。SVN是一种流行的开源版本控制系统,它可以帮助开发者管理和跟踪代码变更。本文将介绍SVN的特点、安装和使用方法。
87 0
|
NoSQL Java 测试技术
分布式工具的一次小升级
之前在做 秒杀架构实践 时有提到对 distributed-redis-tool 的一次小升级,但是没有细说。 其实主要原因是: 秒杀时我做压测:由于集成了这个限流组件,并发又比较大,所以导致连接、断开 Redis 非常频繁。 最终导致获取不了 Redis connection 的异常。
Hadoop大数据平台环境搭建注意事项,波若分布式数据采集工具功能剖析,数道云
Hadoop大数据作为时代发展的产物,影响着互联网企业发展、以及企业关于品牌形象推广、政府有关民意采集、以及有关数据信息收集分类……………… Hadoop技术的发展,带来了海量数据高效处理的能力,也给互联网政企、高校的发展带来了突破性的发展。
1002 0
|
NoSQL Java Redis
分布式工具的一次小升级⏫
前言 之前在做 秒杀架构实践 时有提到对 distributed-redis-tool 的一次小升级,但是没有细说。 其实主要原因是: 秒杀时我做压测:由于集成了这个限流组件,并发又比较大,所以导致连接、断开 Redis 非常频繁。
1110 0
|
数据库 缓存 数据库连接
下一篇
无影云桌面