【阿里云 CDP 公开课】 第四讲:如何访问CDP集群

简介: Cloudera 和阿里云进行深度合作推出了基于阿里云部署的 Cloudera 企业数据云平台,即 CDP 平台。本文主要介绍集群访问Web-UI的方式。

本期导读 :【阿里云 CDP 公开课】第四讲


主题:如何访问 CDP 集群

讲师:佳亮,阿里云计算平台事业部生态技术


内容框架:

  • 前提条件
  • 使用 SSH 隧道方式访问 WEB 服务
  • 使用 Knox代理方式访问 WEB 服务



直播回放链接:(第4讲)

https://developer.aliyun.com/live/248263


前提条件

  • CDP 集群已经成功拉起来了以后
  • 成功添加安全组白名单,并可以成功访问 CM 管控。


使用 SSH 隧道方式访问 WEB 服务

创建从本地服务器开放端口到集群主节点的 SSH 隧道,并运行侦听该端口的本地 SOCKS 代理服务器,端口的数据会由 SSH 隧道转发到集群主节点


创建 SSH 隧道

  • 密钥的方式
ssh-i<密钥文件路径>-N-D8157root@<主节点公网IP地址>
  • 密码的方式
ssh-N-D8157root@<主节点公网IP地址>

相关参数描述如下:

  • 8157:本地服务器端口以8157为例,实际配置时,您可使用本地服务器未被使用的任意一个端口。
  • -D:使用动态端口转发,启动 SOCKS 代理进程并侦听用户本地端口。
  • <主节点公网IP地址>:获取方式请参见获取主节点的公网IP地
  • <密钥文件路径>:密钥文件保存的路径。


配置浏览器

完成动态转发配置以后,您可以从以下两种方式中选择一种来进行浏览器配置。


方式1--Chrome 浏览器命令行方式

  1. 打开命令行窗口,进入本地 Google Chrome 浏览器客户端的安装目录。

操作系统不同,Chrome 浏览器的默认安装目录不同。


操作系统

Chrome默认安装路径

Mac OS X

"/Applications/Google Chrome.app/Contents/MacOS/Google Chrome" \

--user-data-dir="$HOME/chrome-with-proxy" \

--proxy-server="socks5://localhost:8157"

Linux

/usr/bin/google-chrome \ --user-data-dir="$HOME/chrome-with-proxy" \ --proxy-server="socks5://localhost:8157"

Windows

"C:\Program Files (x86)\Google\Chrome\Application\chrome.exe" ^ --user-data-dir="%USERPROFILE%\chrome-with-proxy" ^ --proxy-server="socks5://localhost:8157"

  • 8157:本地服务器端口以8157为例,实际配置时,您可使用本地服务器未被使用的任意一个端口。


在此 Chrome 会话中,您就可以通过内网访问 Cloudera Manager 和其他 Web UI 了。比如:http://cdp-master-1.xxxx.cn-hangzhou.cdp.aliyuncs.com:9870/dfshealth.html#tab-overview

image.png


方式2--配置代理扩展程序的方式

代理扩展程序可以帮助您更加轻松地在浏览器中管理和使用代理,确保网页浏览和集群 Web UI 访问互不干扰。

image.png

  • 安装完成以后,单击 SwitchyOmega 插件,然后在弹出框中选择选项进行配置。
  • 单击新建情景模式,输入情景模式名称(例如SSH pac),情景模式类型选择 PAC 情景模式
  • PAC 脚本中配置以下内容。
functionregExpMatch(url, pattern) {    
try { returnnewRegExp(pattern).test(url); } catch(ex) { returnfalse; }    
}
functionFindProxyForURL(url, host) {
// Important: replace 172.31 below with the proper prefix for your VPC subnetif (shExpMatch(url, "*localhost*")) return"SOCKS5 localhost:8157";
if (shExpMatch(url, "*cdp-*")) return"SOCKS5 localhost:8157";
return'DIRECT';
}
  • 完成上述参数配置后,在左侧导航栏中单击应用选项
  • 打开 Chrome 浏览器,在 Chrome 中单击 SwitchyOmega 插件,切换到之前创建的 SSH tunnel 情景模式下。

image.png

  • 登录 CDP 管控,访问相应服务的 Web UI。 例如:访问 Ranger 页面

image.png


使用 Knox 代理方式访问 WEB 服务

登录到 Knox 所在节点,执行如下命令:

  • 先创建用户 test, 并设置 test 的密码:
1. 先创建用户 test, 并设置test的密码:
> useradd test
> passwd test
  • 将用户 knox 添加到 admin 用户组中:
> usermod -a -G test knox
  • 创建 shadow 组,将 knox 添加到 shadow 组中
# 创建group shadow
> groupadd shadow
# 将root添加到shadow组里
> usermod -a -G shadow root
# 将knox添加到shadow组里
> usermod -a -G shadow knox
# 将文件/etc/shadow的group修改为 shadow
> chgrp shadow /etc/shadow
# 添加/etc/shadow文件 组的读权限:
> chmod g+r /etc/shadow
groupadd shadow
usermod -a -G shadow root
usermod -a -G shadow knox
chgrp shadow /etc/shadow
chmod g+r /etc/shadow

knox 登录页面:https://{ip}:8443/gateway/homepage/home/


使用 admin 用户名+ 密码成功登陆

image.png

image.png


备注--Knox 匹配规则:

^.*$;^https?:(.+\.cdp\.aliyun\.com):[0-9]+?.*$




image.png

大家如果对产品感兴趣,欢迎加入到阿里云 Cloudera 企业数据云交流群。对产品有任何疑问都可以在交流群里咨询。


以下是产品的链接,有需要的用户可以直接点击链接访问和使用产品。


阿里云官网:https://ac.aliyun.com/application/cloudera

或直接访问:https://market.aliyun.com/products/201190008/cmgj00047952.html

免费测试申请:https://survey.aliyun.com/apps/zhiliao/owtTaIQU3




相关文章
|
Java 程序员 Spring
一文读懂 Bean的生命周期
一文读懂 Bean的生命周期
328 0
|
存储 缓存 Linux
Linux Command dnf 软件包管理
Linux Command dnf 软件包管理
Linux Command dnf 软件包管理
|
30天前
|
存储 弹性计算 运维
阿里云渠道商:如何使用阿里云镜像服务?
阿里云镜像服务可快速创建、复制、共享ECS镜像,实现批量部署与环境一致性,支持系统备份恢复,提升运维效率。适用于大促扩容、环境复制等场景。
|
缓存 自然语言处理 API
阿里云百炼产品月刊【2025年4月】
本月刊主要介绍了阿里云百炼平台4月最新更新内容,包括模型服务和产品功能两大部分。在模型服务方面,发布了全新的混合推理模型Qwen3系列,支持思考与非思考模式,性能达到业界顶尖水平;新增了图生视频、语音合成及视觉理解等多款模型,大幅提升多媒体处理能力。产品功能上,新增MCP市场与管理功能,允许用户开通或自定义MCP服务,并在应用中引用以增强能力。此外,部分历史快照模型将于5月8日下线,已实施限流措施。
714 0
|
算法 安全 物联网
如何应用SM2算法进行身份认证
【10月更文挑战第5天】如何应用SM2算法进行身份认证
782 1
|
SQL 关系型数据库 MySQL
在Linux中,如何实现数据备份和恢复?
在Linux中,如何实现数据备份和恢复?
|
机器学习/深度学习 人工智能 TensorFlow
基于TensorFlow的深度学习模型训练与优化实战
基于TensorFlow的深度学习模型训练与优化实战
541 3
|
存储 并行计算 Java
C++线程 并发编程:std::thread、std::sync与std::packaged_task深度解析(二)
C++线程 并发编程:std::thread、std::sync与std::packaged_task深度解析
582 0
PACS系统,覆盖医院所有科室,实现了全院医学影像和报告的信息共享
PACS系统整合医院放射、CT、MR等检查设备,与HIS系统无缝对接,实现自动化申请与报告。支持DICOM及非DICOM影像获取与强大分析功能,覆盖多科室,促进全院影像资源共享,提升医疗服务效率。超声工作站支持灵活报告生成与管理,具备断网离线工作能力,优化病例检索与影像采集流程,配备统计模块以图表形式展示多维度数据分析,助力高效决策。
474 0
PACS系统,覆盖医院所有科室,实现了全院医学影像和报告的信息共享