Kettle查询与连接(七)

简介: Kettle查询与连接(七)

查询

流查询

  • 字典数据完全加载到内存后,在内存中查询,速度快,占内存。
  • 只支持“等于”的查询。 (不支持大于,小于等方式)
  • 如果匹配上多条,只保留最后一条。
  • 如果没有匹配上,新增的字段值为NULL。
  • 如果字典key和要查询的value都是integer,可以选中Key
    and value are exactly one integer field,节省内存。
  • Use sorted list:当比较的字符串比较长的,使用hash方式:

2019050616270083.png

20190506162857505.png

模糊匹配

  • 只支持单列的查询
  • 匹配相似度最大的字符串
  • 自定义匹配的取值范围
  • 支持模糊匹配算法

数据库查询

  • 只返回一行
  • 如果有多行结果: a只返回第-行,b失败
  • 对数据流里的每条记录都要做一次数据库查询,效率低。
  • 数据库查询(加载所有数据到缓存)=表输入+流查询

数据库连接

和单参数的表输入类型,但更灵活:

  • 可以自定义参数位置
  • 参数也可以输出

web查询

2019050621330867.png

记录集连接

20190506213012935.png

相关文章
|
7月前
|
数据库
kettle开发篇-记录集连接
kettle开发篇-记录集连接
174 0
|
7月前
|
数据库连接 数据库
kettle开发篇-流查询
kettle开发篇-流查询
173 0
|
5月前
|
分布式计算 Oracle 大数据
MaxCompute产品使用合集之没有数据源,只是将批量状态和时间写入Oracle表里,该如何操作
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
5月前
|
分布式计算 DataWorks 关系型数据库
MaxCompute操作报错合集之配置mysql数据源querysql模式,同步到MC时遇到报错,该怎么处理
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
|
6月前
|
分布式计算 DataWorks 关系型数据库
DataWorks操作报错合集之数据源同步时,使用脚本模式采集mysql数据到odps中,使用querySql方式采集数据,在脚本中删除了Reader中的column,但是datax还是报错OriginalConfPretreatmentUtil - 您的配置有误。如何解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
6月前
|
关系型数据库 MySQL API
实时计算 Flink版操作报错合集之同步MySQL数据到另一个MySQL数据库,第一次同步后源表数据发生变化时目标表没有相应更新,且Web UI中看不到运行的任务,该怎么解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
199 0
|
7月前
|
数据库
kettle开发篇-分组
kettle开发篇-分组
168 0
|
运维 Ubuntu 关系型数据库
使用kettle采集并处理mysql数据库中的数据
使用kettle采集并处理mysql数据库中的数据
使用kettle采集并处理mysql数据库中的数据
|
SQL 存储 运维
MySQL基础篇——MySQL数据库客户端连接,数据模型,SQL知识
MySQL基础篇——MySQL数据库客户端连接,数据模型,SQL知识
187 0
|
JSON 数据格式 网络架构
Kettle使用接口获取数据(九)
Kettle使用接口获取数据(九)
870 1
Kettle使用接口获取数据(九)