碎碎念
- 数据采集
- 数据发现
- 数据分析
- 数据可视化和协作
当前最新版为 0.10.1 版本,官方提供两种安装包,一种是包含所有解析器的(1.6G),另一种是带有 spark 和网络下载解析器的包(568M)
支持的解析器
- alluxio
- angular
- beam
- bigquery
- cassandra
- elasticsearch
- file
- flink
- flink-cmd
- geode
- groovy
- hazelcastjet
- hbase
- ignite
- influxdb
- java
- jdbc
- jupyter
- kotlin
- ksql
- kylin
- lens
- livy
- md
- mongodb
- neo4j
- pig
- python
- r
- sap
- scalding
- scio
- sh
- spark
- spark-submit
- sparql
- submarine
部署 zeppelin
下载全量解析器安装包
wget --no-check-certificate -c \ https://dlcdn.apache.org/zeppelin/zeppelin-0.10.1/zeppelin-0.10.1-bin-all.tgz tar xf zeppelin-0.10.1-bin-all.tgz
安装 java 环境
zeppelin 部署依赖 java 环境
yum install -y java-1.8.0-openjdk
修改配置文件
cd zeppelin-0.10.1-bin-all cp conf/zeppelin-env.sh.template conf/zeppelin-env.sh vim conf/zeppelin-env.sh
官方给出的配置文件模板是全注释的,这里标注几个需要注意的参数
# 定义 java 命令所在路径,yum 安装的可以不写,下载的 Oracle java 需要配置一下 export JAVA_HOME= # zeppelin 访问地址,如果不配置,默认值 127.0.0.1,也可以写 0.0.0.0 export ZEPPELIN_ADDR= # zeppelin web 页面访问的端口,默认值 8080,如果和本机端口冲突,可以修改这里的参数 export ZEPPELIN_PORT= # sh 解析器绑定的机器 ip,只能写一个,不写的话,会在本机随机获取一个 ip 地址 [多网卡或者有 docker 就比较尴尬了] export ZEPPELIN_LOCAL_IP= # zeppelin 日志目录,默认是当前路径 export ZEPPELIN_LOG_DIR= # zeppelin pid 记录目录,默认记录在 ${ZEPPELIN_HOME}/run 目录下 export ZEPPELIN_PID_DIR= # notebook 存储路径 export ZEPPELIN_NOTEBOOK_DIR=
修改 xml 配置文件
cp conf/zeppelin-site.xml.template conf/zeppelin-site.xml vim conf/zeppelin-site.xml
没特殊需求,可以不配置
- zeppelin 默认的索引路径在 /tmp 目录下,有需求可以修改成自己定义的路径,做统一管理
<property> <name>zeppelin.search.index.path</name> <value>/tmp/zeppelin-index</value> <description>path for storing search index on disk.</description> </property>
- 关闭匿名访问模式 [默认为匿名登录,并且 zeppelin-site.xml 文件内没有这一段内容,需要自己增加] (注意 xml 格式)
false
-表示关闭匿名模式
true
-表示开启匿名模式
<property> <name>zeppelin.anonymous.allowed</name> <value>false</value> <description>Anonymous user allowed by default</description> </property>
- 关闭匿名模式后,需要配置用户名和密码
cp conf/shiro.ini.template conf/shiro.ini vim conf/shiro.ini
配置 <用户名> = <密码>,<角色>
更多细节可以查看官方文档:Apache Shiro Configuration
admin = admin,admin
启动 zeppelin
bash bin/zeppelin-daemon.sh start
通过浏览器访问配置的 ip 加端口来访问 zeppelin