如何杜绝 spark history server ui 的未授权访问? 2-阿里云开发者社区

如何杜绝 spark history server ui 的未授权访问? 2

2023-10-10 196

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

访问控制，不限时长

简介： 如何杜绝 spark history server ui 的未授权访问?

4 未开启 kerberos 的大数据集群环境中，如何杜绝对 shs web ui 的未授权访问？

在没有开启 kerberos 的大数据集群环境中，对 shs ui 进行访问控制，仍需要使用上述 servlet 认证过滤器和访问控制列表机制；
由于 spark 本身并没有提供任何内置的认证过滤器, 大家需要根据自己的认证机制自己实现一个认证过滤器，并配置参数 spark.ui.filters 使用该过滤器；
事实上，Hadoop 提供了一个 servlet 认证过滤器，即 org.apache.hadoop.security.authentication.server.AuthenticationFilter，和几个配套的认证机制的实现类，b包括 PseudoAuthenticationHandler/KerberosAuthenticationHandler/LdapAuthenticationHandler/MultiSchemeAuthenticationHandler/JWTRedirectAuthenticationHandler；
在没有开启 kerberos 的大数据集群环境中，大家可以重点看下 hadoop 提供的 LdapAuthenticationHandler/JWTRedirectAuthenticationHandler 认证过滤器，能否满足自己对 shs ui 认证的需要；

如果上述 hadoop 提供的认证过滤去不满足自己对 shs ui 认证的需要，大家需要根据自己的认证机制自己实现一个认证过滤器；
笔者在此提供一个简单的认证过滤器，该过滤器；

package com.hundsun.broker;
import org.apache.commons.codec.binary.Base64;
import org.apache.commons.lang3.StringUtils;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import javax.servlet.*;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import java.io.IOException;
import java.io.UnsupportedEncodingException;
import java.util.StringTokenizer;
/*
该类是一个简单的 servlet 安全过滤器，可以配置 spark history server web ui 使用该安全过滤器，以实现基本的访问控制
需要配合以下参数一起使用： 
  spark.ui.filters，spark.history.ui.acls.enable，
  spark.history.ui.admin.acls，spark.history.ui.admin.acls.groups
 */
public class BasicAuthenticationFilter implements Filter {
  /** Logger */
  private static final Logger LOG = LoggerFactory.getLogger(BasicAuthenticationFilter.class);
  private String username = "";
  private String password = "";
  private String realm = "Protected";
  /*
  该方法使用指定的参数初始化该安全过滤器
  具体参数包括：
    用户名 username
    密码 password
    安全域 realm
   */
  @Override
  public void init(FilterConfig filterConfig) throws ServletException {
    username = filterConfig.getInitParameter("username");
    password = filterConfig.getInitParameter("password");
    realm  = filterConfig.getInitParameter("realm");
    if ( StringUtils.isBlank( username ) ) {
      throw new ServletException( "No user provided in filter configuration" );
    }
    if ( StringUtils.isBlank( password ) ) {
      throw new ServletException( "No password provided in filter configuration" );
    }
    if ( StringUtils.isBlank( realm ) ) {
      throw new ServletException( "No realm provided in filter configuration" );
    }
  }
  /*
  该方法对 http 请求进行安全过滤，具体过滤逻辑是：
  检查 http header 中 Authorization 是否为 Basic，并提取 header 中的用户名和密码
  将 header 中提取的用户名和密码，跟初始化该过滤器时使用的用户名和密码进行对比，若一致则认证通过
  其他情况则认证失败
   */
  @Override
  public void doFilter(ServletRequest servletRequest, ServletResponse servletResponse, FilterChain filterChain)
      throws IOException, ServletException {
    HttpServletRequest request = (HttpServletRequest) servletRequest;
    HttpServletResponse response = (HttpServletResponse) servletResponse;
    String authHeader = request.getHeader("Authorization");
    if (authHeader != null) {
      StringTokenizer st = new StringTokenizer(authHeader);
      if (st.hasMoreTokens()) {
        String basic = st.nextToken();
        if (basic.equalsIgnoreCase("Basic")) {
          try {
            String credentials = new String(Base64.decodeBase64(st.nextToken()), "UTF-8");
            LOG.debug("Credentials: " + credentials);
            int p = credentials.indexOf(":");
            if (p != -1) {
              String _username = credentials.substring(0, p).trim();
              String _password = credentials.substring(p + 1).trim();
              if (!username.equals(_username) || !password.equals(_password)) {
                unauthorized(response, "Bad credentials");
              }
              filterChain.doFilter(servletRequest, servletResponse);
            } else {
              unauthorized(response, "Invalid authentication token");
            }
          } catch (UnsupportedEncodingException e) {
            throw new Error("Couldn't retrieve authentication", e);
          }
        }
      }
    } else {
      unauthorized(response);
    }
  }
  @Override
  public void destroy() {
  }
  private void unauthorized(HttpServletResponse response, String message) throws IOException {
    response.setHeader("WWW-Authenticate", "Basic realm=\"" + realm + "\"");
    response.sendError(401, message);
  }
  private void unauthorized(HttpServletResponse response) throws IOException {
    unauthorized(response, "Unauthorized");
  }
}

使用该认证过滤器，配合以下参数，即可实现对 shs ui 的访问控制：

//通过以下配置项开启了 shs ui 的认证 - 使用自定义认证过滤器
spark.ui.filters=org.apache.spark.deploy.yarn.YarnProxyRedirectFilter,com.hundsun.broker.BasicAuthenticationFilter
spark.com.hundsun.broker.BasicAuthenticationFilter.param.username=spark
spark.com.hundsun.broker.BasicAuthenticationFilter.param.password=spark
spark.com.hundsun.broker.BasicAuthenticationFilter.param.realm=spark
//通过以下配置项，开启 shs ui 的访问控制列表 acl
spark.history.ui.acls.enable=true
spark.history.ui.admin.acls=spark
spark.history.ui.admin.acls.groups=spark

注意在 CDH 平台中，可能是由于 CM 自身启动 shs 的机制和背后配置机制等原因，在 History Server 高级配置代码段中的配置项 “spark.ui.filters=org.apache.spark.deploy.yarn.YarnProxyRedirectFilter”，在启动 shs 时并没有生效，所以需要手动修改配置文件 spark-defaults.conf，并手动通过命令行启动 shs：

此时用户访问 shs ui 时需要提供认证信息，只有提供了正确的用户名和密码才能访问 shs ui（用户名和密码通过后台参数 spark.com.hundsun.broker.BasicAuthenticationFilter.param.username/spark.com.hundsun.broker.BasicAuthenticationFilter.param.password=spark指定，安全过滤器初始化时会读取这些参数）；
此时只有使用访问控制列表中指定的用户和用户组，才能查看 shs ui 中具体应用信息的详细信息；

Spark 源码中相关类：

org.apache.spark.ui.HttpSecurityFilter#doFilter
org.apache.spark.internal.config.UI#UI_FILTERS
org.apache.spark.scheduler.cluster.YarnSchedulerBackend#addWebUIFilter

如何杜绝 spark history server ui 的未授权访问? 2

4 未开启 kerberos 的大数据集群环境中，如何杜绝对 shs web ui 的未授权访问？

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

如何杜绝 spark history server ui 的未授权访问? 2

4 未开启 kerberos 的大数据集群环境中，如何杜绝对 shs web ui 的未授权访问？

热门文章

最新文章

相关课程

相关电子书

相关实验场景