kettle从sftp下载多个文件并进行转换后输出

简介: kettle从sftp下载多个文件并进行转换后输出

一. 主流程梳理



网络异常,图片无法展示
|


主流程


  • 1 获取sftp上对应文件的存放路径;
  • 2 从sftp下载指定的文件到指定的目录;
  • 3 从下载后的指定目录,获取数据进行转换操作;


二. 获取ftp路径



网络异常,图片无法展示
|


获取ftp路径


1. 生成记录


网络异常,图片无法展示
|


生成记录


此处要注意: 限制为1;


2. JavaScript代码


网络异常,图片无法展示
|


JavaScript代码


可通过点击测试脚本按钮测试脚本执行是否正确.

//Script here
Date.prototype.Format = function (fmt) { 
    var o = {  
        "M+": this.getMonth() + 1, //月份   
        "d+": this.getDate(), //日   
        "h+": this.getHours(), //小时   
        "m+": this.getMinutes(), //分   
        "s+": this.getSeconds(), //秒   
        "q+": Math.floor((this.getMonth() + 3) / 3), //季度   
        "S": this.getMilliseconds() //毫秒   
    };  
    if (/(y+)/.test(fmt)) fmt = fmt.replace(RegExp.$1, (this.getFullYear() + "").substr(4 - RegExp.$1.length));  
    for (var k in o)  
    if (new RegExp("(" + k + ")").test(fmt)) fmt = fmt.replace(RegExp.$1, (RegExp.$1.length == 1) ? (o[k]) : (("00" + o[k]).substr(("" + o[k]).length)));  
    return fmt;  
}  
var url=new Date(new Date().getTime()).Format("yyyyMMdd");


3.设置变量


网络异常,图片无法展示
|


设置变量


可通过点击获取字段按钮快速设置变量.


三.SFTP下载



通过SFTP下载文件到指定的目录,配置如下:


网络异常,图片无法展示
|


服务器配置


配置完成后,可通过点击测试连接进行测试是否配置成功.


网络异常,图片无法展示
|


文件配置


配置完成后,可通过点击测试文件夹查看文件夹是否存在.


四.进行数据转换



网络异常,图片无法展示
|


数据转换流程


1.文件输入


网络异常,图片无法展示
|


文件配置


网络异常,图片无法展示
|


内容配置


网络异常,图片无法展示
|


字段配置


2.排序记录


网络异常,图片无法展示
|


排序记录


3.记录集连接


网络异常,图片无法展示
|


配置记录集连接类型


4.过滤记录


网络异常,图片无法展示
|


设置过滤条件


5.文本输出


网络异常,图片无法展示
|


设置输出目录和文件


网络异常,图片无法展示
|


设置输出内容格式


网络异常,图片无法展示
|


指定输出字段

OK!至此流程梳理完毕!

相关文章
|
6月前
|
Shell Linux 编译器
【Shell 命令集合 备份压缩 】Linux 提取zip压缩文件的详细信息 zipinfo命令 使用指南
【Shell 命令集合 备份压缩 】Linux 提取zip压缩文件的详细信息 zipinfo命令 使用指南
108 0
|
6月前
|
存储 Shell Linux
【Shell 命令集合 备份压缩 】Linux 解码uuencode编码的文件 uudecode 命令 使用指南
【Shell 命令集合 备份压缩 】Linux 解码uuencode编码的文件 uudecode 命令 使用指南
81 0
|
6月前
|
安全 Shell Linux
【Shell 命令集合 备份压缩 】Linux将可执行文件压缩成gzip格式 gzexe命令 使用指南
【Shell 命令集合 备份压缩 】Linux将可执行文件压缩成gzip格式 gzexe命令 使用指南
89 0
|
自然语言处理 Python Windows
基于Windows安装langconv实现繁体和简体字的转换
基于Windows安装langconv实现繁体和简体字的转换
394 0
基于Windows安装langconv实现繁体和简体字的转换
|
5天前
|
存储 Java API
Java实现导出多个excel表打包到zip文件中,供客户端另存为窗口下载
Java实现导出多个excel表打包到zip文件中,供客户端另存为窗口下载
16 4
|
1月前
|
Java
java实现从HDFS上下载文件及文件夹的功能,以流形式输出,便于用户自定义保存任何路径下
java实现从HDFS上下载文件及文件夹的功能,以流形式输出,便于用户自定义保存任何路径下
55 2
java实现从HDFS上下载文件及文件夹的功能,以流形式输出,便于用户自定义保存任何路径下
文件打开的格式
文件打开的格式
|
3月前
|
关系型数据库 MySQL 数据库
MySQL数据库安装——zip压缩包形式
MySQL数据库安装——zip压缩包形式
83 2
|
6月前
|
算法 Shell Linux
【Shell 命令集合 备份压缩 】Linux 解压缩ARJ格式 unarj命令 使用指南
【Shell 命令集合 备份压缩 】Linux 解压缩ARJ格式 unarj命令 使用指南
61 0
|
算法 数据处理 Python
python ——批量读取相同格式文件(多个文件夹/单个文件夹)---nc文件为例
在处理多个相同格式的文件时,python中的许多模块可以为我们提供很多遍历。 比如,我们想读取一个文件夹下多个相同格式的文件时 可以使用os模块,
python ——批量读取相同格式文件(多个文件夹/单个文件夹)---nc文件为例