Kettle查询与连接(七)

简介: Kettle查询与连接(七)

查询

流查询

  • 字典数据完全加载到内存后,在内存中查询,速度快,占内存。
  • 只支持“等于”的查询。 (不支持大于,小于等方式)
  • 如果匹配上多条,只保留最后一条。
  • 如果没有匹配上,新增的字段值为NULL。
  • 如果字典key和要查询的value都是integer,可以选中Key
    and value are exactly one integer field,节省内存。
  • Use sorted list:当比较的字符串比较长的,使用hash方式:

2019050616270083.png

20190506162857505.png

模糊匹配

  • 只支持单列的查询
  • 匹配相似度最大的字符串
  • 自定义匹配的取值范围
  • 支持模糊匹配算法

数据库查询

  • 只返回一行
  • 如果有多行结果: a只返回第-行,b失败
  • 对数据流里的每条记录都要做一次数据库查询,效率低。
  • 数据库查询(加载所有数据到缓存)=表输入+流查询

数据库连接

和单参数的表输入类型,但更灵活:

  • 可以自定义参数位置
  • 参数也可以输出

web查询

2019050621330867.png

记录集连接

20190506213012935.png

相关文章
|
6月前
|
数据库
kettle开发篇-记录集连接
kettle开发篇-记录集连接
151 0
|
6月前
|
数据库连接 数据库
kettle开发篇-流查询
kettle开发篇-流查询
160 0
|
SQL Oracle 关系型数据库
sqoop的导入导出以及where条件过滤数据导出
sqoop的导入导出以及where条件过滤数据导出
|
6月前
|
Java 数据库连接 对象存储
实时计算 Flink版操作报错之表可以自动建,但数据无法导入,连接Starrocks 的be时候,报错,是什么原因
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
|
3月前
|
SQL Oracle 关系型数据库
实时计算 Flink版产品使用问题之连接到MySQL的从库时遇到其他服务也连接到了从库,该如何处理
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
6月前
|
JSON NoSQL MongoDB
mongodb导出聚合查询的数据
mongodb导出聚合查询的数据
|
6月前
|
数据库
kettle开发篇-分组
kettle开发篇-分组
152 0
|
SQL 分布式计算 Java
如何在 hive udf 中访问配置数据-踩坑记录,方案汇总与对比-udf中可以写sql吗?
如何在 hive udf 中访问配置数据-踩坑记录,方案汇总与对比-udf中可以写sql吗?
|
运维 Ubuntu 关系型数据库
使用kettle采集并处理mysql数据库中的数据
使用kettle采集并处理mysql数据库中的数据
使用kettle采集并处理mysql数据库中的数据
|
SQL 存储 运维
MySQL基础篇——MySQL数据库客户端连接,数据模型,SQL知识
MySQL基础篇——MySQL数据库客户端连接,数据模型,SQL知识
171 0