离线数仓之Kerberos基本使用及问题记录

2023-01-03 155

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 离线数仓之Kerberos基本使用及问题记录

离线数仓之Kerberos基本使用及问题记录

0. 写在前面

Kerberos环境：已搭建好Kerberos并配置完成
执行用户：root
Linux：CentOS7.5
Hadoop：Hadoop3.1.3
Hive：Hive3.1.2
Kerberos：Kerberos5

集群规划：

node01：NN、DN、historyserver、Hive、Kerberos服务端、Kerberos客户端
node02：NM、RM、Kerberos客户端
node03：DN、2NN、Kerberos客户端

1. Kerberos基本使用

0. 启动Kerberos相关服务

在主节点（node01）启动KDC，并配置开机自启

[root@node01 ~]# systemctl start krb5kdc[root@node01 ~]# systemctl enable krb5kdc

1. 安全模式下启动Hadoop集群

启动HDFS

# 启动NameNode[root@root ~]# sudo -i -u hdfs hdfs --daemon start namenode# 启动DataNode[root@node01 ~]# sudo -i -u hdfs hdfs --daemon start datanode[root@node01 ~]# sudo -i -u hdfs hdfs --daemon start datanode[root@node01 ~]# sudo -i -u hdfs hdfs --daemon start datanode# 启动SecondaryNameNode[root@node01 ~]# sudo -i -u hdfs hdfs --daemon start secondarynamenode

启动Yarn

# 启动ResourceManager[root@node02 ~]# sudo -i -u yarn yarn --daemon start resourcemanager# 启动NodeManager[root@node01 ~]# sudo -i -u yarn yarn --daemon start nodemanager[root@node02 ~]# sudo -i -u yarn yarn --daemon start nodemanager[root@node03 ~]# sudo -i -u yarn yarn --daemon start nodemanager

启动HistoryServer

# 启动历史服务器[root@node01 ~]# sudo -i -u mapred mapred --daemon start historyserver

2. 安装Kerberos客户端访问HDFS页面

0. Windows下安装MIT Kerberos Ticket Manager

一路next即可，安装后会提醒是否立即 重启电脑

有遇到过没有提醒直接重启电脑的，为了保险起见，建议安装之前先将集群的各个服务停止，关闭虚拟机

1. 使用「MIT Kerberos Ticket Manager」

编辑C:\ProgramData\MIT\Kerberos5\krb5.ini文件

[libdefaults]
 dns_lookup_realm = false
 ticket_lifetime = 24h
 forwardable = true
 rdns = false
 default_realm = EXAMPLE.COM
[realms]
 EXAMPLE.COM = {
  kdc = node01
  admin_server = node01
 }
[domain_realm]

2. 配置火狐浏览器

在地址栏输入 about:config ,直接Enter，选择 接受风险并继续

直接搜索 network.negotiate-auth.trusted-uris ，修改值为要访问的主机名（node01）

搜索 network.auth.use-sspi ，双击将值变为false

重启火狐浏览器

3. 认证

启动Kerberos客户端，点击 Get Ticket ，输入主体名Principal以及密码Password

火狐浏览器访问：

https://node01:9871/

选择 browse the file system ，输入主体名Principal以及密码Password，即可访问文件

3. Web端依旧没有权限访问文件及报错解决

火狐浏览器输入主体名及密码，出现以下错误:

Ticket initialization failed. Kerberos 5: client not found in Kerberos database(error:1765328378)

我查找了很久，还是没有找到这个错误的解决方法。因为我的配置是没有问题的，所以猜想会不会是浏览器的问题，没想到， 重启火狐浏览器，再次访问HDFS 真的就可以有权限访问文件了

重启 万岁!!!

4. Hive Kerberos认证使用之DataGrip客户端

0. 前置芝士

因为Apache Hive使用的驱动是原生自带的Hive驱动，但是这个自带的Hive驱动不支持Kerberos认证。所以连接不上之前数仓分层时在DataGrip创建的Hive数据源。

1. 新建driver

2. 配置Driver

3. 新建连接

4. 配置连接

基础配置

jdbc:hive2://node01:10000/;principal=hive/node01@EXAMPLE.COM

高级配置

配置参数：

-Djava.security.krb5.conf="C:\\ProgramData\\MIT\\Kerberos5\\krb5.ini"
-Djava.security.auth.login.config="C:\\ProgramData\\MIT\\Kerberos5\\atguigu.conf"
-Djavax.security.auth.useSubjectCredsOnly=falsev

5. 编写JAAS（Java认证授权服务）配置文件

com.sun.security.jgss.initiate{
      com.sun.security.auth.module.Krb5LoginModule required
      useKeyTab=true
      useTicketCache=false
      keyTab="C:\\ProgramData\\MIT\\Kerberos5\\atguigu.keytab"
      principal="atguigu@EXAMPLE.COM";
};

6. 为用户生成keytab文件，在krb5kdc所在节点（node01）执行以下命令

[root@hadooop102]# kadmin.local -q"xst -norandkey -k /home/atguigu/atguigu.keytab atguigu"

7. 传输atguigu.keytab文件

将上一步生成的 atguigu.keytab 文件，置于Windows中的特定路径，该路径须与5中的keyTab属性的值 保持一致 。

XFTP传输atguigu.keytab若不成功，将其 chmod 777

8. 测试连接失败

报错信息

原因分析

jdbc:hive2://node01:10000/;principal=hive/node01@EXAMPLE.COM 最后多了一个空格或者直接删掉DataGrip中的url，重新复制上文中的「4. 配置连接」的url

顺利完成

离线数仓之Kerberos基本使用及问题记录

离线数仓之Kerberos基本使用及问题记录

0. 写在前面

1. Kerberos基本使用

0. 启动Kerberos相关服务

1. 安全模式下启动Hadoop集群

2. 安装Kerberos客户端访问HDFS页面

0. Windows下安装MIT Kerberos Ticket Manager

1. 使用「MIT Kerberos Ticket Manager」

2. 配置火狐浏览器

3. 认证

3. Web端依旧没有权限访问文件及报错解决

4. Hive Kerberos认证使用之DataGrip客户端

0. 前置芝士

1. 新建driver

2. 配置Driver

3. 新建连接

4. 配置连接

5. 编写JAAS（Java认证授权服务）配置文件

6. 为用户生成keytab文件，在krb5kdc所在节点（node01）执行以下命令

7. 传输atguigu.keytab文件

8. 测试连接失败

热门文章

最新文章

相关课程

相关电子书

相关实验场景