数据对接—kettle使用之二

简介:

这一篇开始进入kettle的一些常用插件的使用介绍,通过实例介绍不同插件的功能。这一篇说(Data Grid和文本文件输出)的使用。

文本文件输出介绍(可以略过,一般用不着):
      1、Run this as a command instead:把结果输出到命令行或者脚本
      2、文件名里包含步骤数:如果你在多个拷贝中运行步骤,拷贝的数量将包含到文件名中。
      3、Include partition nr in filename:文件名中包含数据分区数量
      4、文件名包含日期
      5、文件名包含时间
      6、追加
      7、分隔符
      8、封闭符:封闭字段的一对字符,可选
      9、强制在字段周围加上封闭符
      10、头部:如果享有一个头部行,选中
      11、尾部:如果享有一个尾部行,选中
      12、格式:DOS文件的分隔符可以是回车或换行符
      13、编码:指定编码,如果空白就是用系统缺省的编码
      14、Compression(压缩):指定压缩的类型(zip,gzip)
      15、Right pad fields:在字段最后添加空格或者删除字符,直到长度达到指定
      16、Fast data dump(no formatting):当处理大量数据到一个文本文件时,提高性能.(不包含任何格式化信息)
      17、分拆每一行:如果n比0大,用n行拆分文本文件,分割成多个部分。
      18、Add Ending line of file:指定输出文本的额结束行。

具体操作:

      首先,启动软件,新建转换作业,如下图:

       

       

      其次,就可以在空白区域拖拽插件进行数据对接了,我们先做个测试表数据输出到文本文件中,用到的插件有Data Grid文本文件输出,如下图:

       

      打开Data Grid并编辑测试数据,如下图:

       

       

       打开文本文件输出并自动获取字段和编辑输出路径,如下图:

        

       

      上面看到的只是一些最基本的操作,想要个性化的配置需要对每个插件里的配置项进行配置,弄好之后我们就可以点击运行按钮了(记得一定要先保存哦),看输出结果,如下图:

   

   

      运行后我们可以看到还有输出日志,还有每一步执行的结果显示输出,方便我们查看,最后的运行结果会在指定好的路径创建出一个文本文件,打开文件如下图所示:

       


这一篇就到这里,下篇我们继续演示其它插件的使用…

目录
相关文章
|
SQL Oracle 关系型数据库
「集成架构」2020年最好的15个ETL工具(第二部)
「集成架构」2020年最好的15个ETL工具(第二部)
|
SQL 分布式计算 Oracle
「集成架构」2020年最好的15个ETL工具(第一部)
「集成架构」2020年最好的15个ETL工具(第一部)
|
消息中间件 SQL Oracle
技术干货|如何利用 ChunJun 实现数据实时同步?
ChunJun技术分享干货来了!实时同步是 ChunJun 的⼀个重要特性,本文将为大家介绍如何使用 ChunJun 实时同步,以及 ChunJun ⽀持的 RDB 实时采集插件的特性、采集逻辑及其原理,帮助大家更好地理解 ChunJun 与实时同步,欢迎点进正文阅读。
478 0
|
Java 关系型数据库 数据库
|
存储 SQL 数据库连接
|
XML SQL 数据库
|
SQL 数据库连接 数据库
|
XML 数据格式