kettle-ldap input

简介: 使用kettle从ad提取数据,调用rest进行数据装载

由于项目需要,需要从AD域中将用户同步至系统中,故使用kettle进行数据提取、转换、装载。
大致思路:
1、使用ldap协议从ad提取数据
2、进行数据转换,选取指定字段数据并转为json格式数据
3、使用rest client进行数据装载
如下图:
image

1、提取数据

使用ldap input组件提取数据

  • 1、填写ldap连接参数
  • 2、定义需要提取的数据范围
  • 3、分页设置
  • 4、定义需要获取的字段
    image

image

image

image

ldap查询语法

Operator Meaning
&   AND, all conditions must be met
|   OR, any of the conditions must be met
!   NOT, the clause must evaluate to False

eg: (|(cn=Jim Smith)(&(givenName=Jim)(sn=Smith)))


Character Hex Representation
*   \2A
(   \28
)   \29
\   \5C
Nul   \00

eg:(cn=James Jim\2A\29 Smith)  where the common name is "James Jim*) Smith"

2、数据转换

  • 1、使用字段选择过滤需要的字段和进行重命名,以与后续调用接口进行映射
  • 2、将ldap提取的多条记录合并,转为json,提高调用rest的效率

image

image

image

3、数据装载

  • 1、调用restful api进行数据装载
    image
相关文章
|
11月前
|
SQL 分布式计算 Java
Hive教程(07)- Hive自定义用户名密码验证(已开源)
Hive教程(07)- Hive自定义用户名密码验证(已开源)
290 0
|
2月前
|
人工智能 安全 网络安全
LDAP学习笔记之三:389-DS(RHDS) 之TLS配置
LDAP学习笔记之三:389-DS(RHDS) 之TLS配置
|
4月前
|
分布式计算 大数据 数据处理
MaxCompute操作报错合集之在本地用tunnel命令上传excel表格到mc遇到报错: tunnel upload C:\Users***\Desktop\a.xlsx mc里的非分区表名 -s false;该怎么办
MaxCompute是阿里云提供的大规模离线数据处理服务,用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时,可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。
|
存储 API 数据安全/隐私保护
使用jMeter的csv data set config避免用户密码的硬编码
使用jMeter的csv data set config避免用户密码的硬编码
139 0
使用jMeter的csv data set config避免用户密码的硬编码
|
消息中间件 NoSQL Oracle
logstash_output_mongodb插件用途及安装详解
0、logstash-output-mongodb用途 Writes events to MongoDB,也就是向mongodb里面写入数据。 来源可以是:jdbc类的Mysql、oracle关系型数据库;也可以是Elasticsearch等。 后续的同步应用中会用到该插件,所以单独列出来。并且,默认logstash不安装该插件,需要手动安装。
372 0
|
SQL Java 数据库连接
|
存储
Confluence 6 连接一个 LDAP 目录概述
你可以连接你的 Confluence 到一个 LDAP 目录服务器上,你可以通过连接的 LDAP 目录服务器为你的 Confluence 进行授权,用户和用户组管理。
1415 0
|
Web App开发 关系型数据库 测试技术
|
Apache 数据安全/隐私保护 Windows