Zeppelin安装与配置

本文涉及的产品
实时计算 Flink 版,1000CU*H 3个月
简介: 本文介绍zeppelin安装与配置指南

zeppelin安装包下载

mkdir /data && cd /data
wget https://dlcdn.apache.org/zeppelin/zeppelin-0.10.0/zeppelin-0.10.0-bin-all.tgz

tar zxvf zeppelin-0.10.0-bin-all.tgz
ln -s /data/zeppelin-0.10.0-bin-all /data/zeppelin

zeppelin配置文件修改

Zeppelin配置分为两个部分,一个是Zeppelin Server,另一个则是Interpreter。其中,Zeppelin Server相关配置需要在启动Zeppelin Server之前进行配置。而Interpreter的配置则是可以在Zeppelin Server启动之后,在WEB界面进行配置。

而在WEB界面对Interpreter进行配置时,还可以全局配置或者针对每个note book进行配置。note book级别的配置会覆盖全局配置。

Zeppelin Server配置

zeppelin server的配置文件为zeppelin-env.sh以及zeppelin-site.xml

其中,

  • zeppelin-env.sh定义环境变量
  • zeppelin-site.xml定义系统属性

按照优先级顺序,zeppelin-env.sh文件中定义的配置会覆盖zeppelin-site.xml中定义的配置。

以下列出部分参数,更多参数可参考相关文件。

zeppelin-env.sh zeppelin-site.xml Default value Description
ZEPPELIN_ADDR zeppelin.server.addr 127.0.0.1 Zeppelin server binding address
ZEPPELIN_PORT zeppelin.server.port 8080 Zeppelin server portNote: Please make sure you're not using the same port with Zeppelin web application development port (default: 9000).

具体修改点

cd /data/zeppelin/conf
cp zeppelin-site.xml.template zeppelin-site.xml

将zeppelin.server.addr配置项修改为0.0.0.0

zeppelin默认端口使用8080,如果和你本地端口冲突可将其改为别的端口,本文档将端口修改为8008,也就是将zeppelin.server.port配置项修改为8008

cp zeppelin-env.sh.template zeppelin-env.sh

填入以下变量:

export JAVA_HOME=/data/jdk

各变量请根据自己环境进行设置。

Interpreter 配置

  1. 全局参数配置

    首页右上角点击interpreter进入zeppelin所有支持的interpreter界面。

    进入如下界面:

    在该界面对interpreter进行的配置修改则是全局生效的,下面以flink为例,可以修改其中的properties来使该配置全局生效。

  2. note book级别参数配置

    同样以flink为例,新建flink interpreter对应的note book,进行如下配置。

启动zeppelin

bin/zeppelin-daemon.sh start

此时如果你们没有创建logs文件夹以及run文件夹,那么会在zeppelin目录下自动创建,如下所示:

[root@hadoop zeppelin]# bin/zeppelin-daemon.sh start
Log dir doesn't exist, create /data/zeppelin/logs
Pid dir doesn't exist, create /data/zeppelin/run
Zeppelin start                                             [  OK  ]

此时浏览器输入zeppelin服务器ip:8008或者hostname:8008即可进入如下页面:

基本使用

点击Notebook,点击Create new note,填写文本名称以及选定flink interpreter,如下所示:

新建完之后进入如下页面:

相关实践学习
基于Hologres+Flink搭建GitHub实时数据大屏
通过使用Flink、Hologres构建实时数仓,并通过Hologres对接BI分析工具(以DataV为例),实现海量数据实时分析.
实时计算 Flink 实战课程
如何使用实时计算 Flink 搞定数据处理难题?实时计算 Flink 极客训练营产品、技术专家齐上阵,从开源 Flink功能介绍到实时计算 Flink 优势详解,现场实操,5天即可上手! 欢迎开通实时计算 Flink 版: https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍: Flink Forward 是由 Apache 官方授权,Apache Flink Community China 支持的会议,通过参会不仅可以了解到 Flink 社区的最新动态和发展计划,还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验,是 Flink 开发者和使用者不可错过的盛会。 去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与,一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况,Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。
相关文章
|
SQL 分布式计算 数据可视化
Apache Zeppelin系列教程第一篇——安装和使用
Apache Zeppelin系列教程第一篇——安装和使用
806 0
|
SQL HIVE 流计算
flink写hdfs inprogress文件问题
flink落地到hdfs的文件,在hive中读不到
2844 0
|
搜索推荐 Java 数据库
基于SpringBoot校园二手书交易管理系统
基于SpringBoot校园二手书交易管理系统
|
SQL 数据可视化 关系型数据库
5个实用的SQLite数据库可视化工具(GUI)
5个实用的SQLite数据库可视化工具(GUI)
2846 3
Zeppelin安装教程
Zeppelin安装教程
153 1
|
5月前
|
运维 分布式计算 Kubernetes
【能力比对】K8S数据平台VS数据平台
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
【能力比对】K8S数据平台VS数据平台
|
7月前
|
存储 关系型数据库 MySQL
Flink基于Paimon的实时湖仓解决方案的演进
Flink基于Paimon的实时湖仓解决方案的演进
199 0
|
存储 SQL 分布式计算
Hive存储表数据的默认位置详解
【8月更文挑战第31天】
1120 1
|
9月前
|
移动开发 JSON API
1688 商品详情数据接口(H5、APP 端)
1688商品详情数据接口是1688平台提供的数据交互通道,支持H5和APP端,提供商品的全面信息(如标题、价格、库存、销量等),并实时更新。开发者可通过HTTP/HTTPS协议调用接口,使用GET或POST方法获取数据。示例代码展示了如何用Python请求该接口,需替换API密钥和商品ID。
|
SQL 数据处理 数据库
时序数据库 TDengine SQL 查询语法规则汇总,官方教程奉上!
TDengine 采用 SQL 作为查询语言,本文将就部分查询细则做分析。
981 1