kettle基础概念理解

简介: kettle基础概念理解

 转换: 可以视为一个原子操作,里面可以单独的进行一些输入、输出,或者执行一个sql脚本,每个转换可以单独执行,保存之后后缀名为ktr。

作业:一个作业可以包含多个作业或者转换,可以单独执行,保存之后后缀名为kjb。

核心对象-脚本-执行SQL脚本:可以作为转换的一部分,配置过后,可以单独执行某个脚本。

核心对象-输入-表输入:数据来源可以为表或者是sql语句查询的结果集。

核心对象-输出-表输出:通常配合表输入来使用,进行相关映射来插入相应表的数据。

参考文章:

    1. kettle详解(数据抽取、转换、装载):

    https://www.cnblogs.com/cc66/p/9171442.html

         2.kettle如何共享数据库连接:

    https://www.cnblogs.com/drunkPullBreeze/p/13498071.html

           3.kettle 中文网。

    https://www.kettle.net.cn/

           4. kettle配置数据源之使用JNDI方式

    https://www.cnblogs.com/liyunzhouts/p/7927900.html

    目录
    相关文章
    |
    15天前
    |
    SQL 分布式计算 监控
    Sqoop数据迁移工具使用与优化技巧:面试经验与必备知识点解析
    【4月更文挑战第9天】本文深入解析Sqoop的使用、优化及面试策略。内容涵盖Sqoop基础,包括安装配置、命令行操作、与Hadoop生态集成和连接器配置。讨论数据迁移优化技巧,如数据切分、压缩编码、转换过滤及性能监控。此外,还涉及面试中对Sqoop与其他ETL工具的对比、实际项目挑战及未来发展趋势的讨论。通过代码示例展示了从MySQL到HDFS的数据迁移。本文旨在帮助读者在面试中展现Sqoop技术实力。
    27 2
    |
    16天前
    |
    SQL 存储 分布式计算
    Hive数据仓库设计与优化策略:面试经验与必备知识点解析
    本文深入探讨了Hive数据仓库设计原则(分区、分桶、存储格式选择)与优化策略(SQL优化、内置优化器、统计信息、配置参数调整),并分享了面试经验及常见问题,如Hive与RDBMS的区别、实际项目应用和与其他组件的集成。通过代码样例,帮助读者掌握Hive核心技术,为面试做好充分准备。
    |
    12天前
    |
    SQL HIVE
    Hive【Hive学习大纲】【数据仓库+简介+工作原理】【自学阶段整理的xmind思维导图分享】【点击可放大看高清】
    【4月更文挑战第6天】Hive【Hive学习大纲】【数据仓库+简介+工作原理】【自学阶段整理的xmind思维导图分享】【点击可放大看高清】
    14 0
    |
    3月前
    流式系统:第九章到第十章
    流式系统:第九章到第十章
    18 0
    |
    8月前
    |
    大数据 Linux 网络安全
    |
    9月前
    |
    存储 SQL 缓存
    探秘MySQL底层架构:设计与实现流程一览
    Mysql,作为一款优秀而广泛使用的数据库管理系统,对于众多Java工程师来说,几乎是日常开发中必不可少的一环。无论是存储海量数据,还是高效地检索和管理数据,Mysql都扮演着重要的角色。然而,除了使用Mysql进行日常开发之外,我们是否真正了解它的底层架构以及设计实现的流程呢?本篇博客将带您深入探索Mysql底层架构的设计与实现流程,帮助您更好地理解和应用这个强大的数据库系统。让我们一同揭开Mysql底层的神秘面纱,探寻其中的奥秘。
    36335 14
    探秘MySQL底层架构:设计与实现流程一览
    |
    11月前
    |
    Oracle Java 关系型数据库
    Kettle 常见问题解决方案
    JDK版本大于1.8时非常不稳定,表现在无法新建连接DB数据库,会出现无响应。
    |
    Java 关系型数据库 数据库连接
    OushuDB 用户指南之编程接口
    OushuDB 用户指南之编程接口
    51 0
    |
    存储 分布式计算 资源调度
    吐血整理的Hadoop最全开发指南【完全分布式集群部署篇】(开发重点)(下)
    吐血整理的Hadoop最全开发指南【完全分布式集群部署篇】(开发重点)(下)
    154 0
    |
    分布式计算 资源调度 安全
    吐血整理的Hadoop最全开发指南【完全分布式集群部署篇】(开发重点)(上)
    吐血整理的Hadoop最全开发指南【完全分布式集群部署篇】(开发重点)
    447 0