文档备案控制台

开发者社区大数据文章正文

Apache Zepplin使用Hive Interpreter查询

2019-09-05 1520

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 1.Hadoopa).配置core-site.xmlhadoop文件core-site.xml中配置信息如下，重启HDFS<property> <name>hadoop.proxyuser.

1.Hadoop

a).配置core-site.xml

hadoop文件core-site.xml中配置信息如下，重启HDFS

<property>
    <name>hadoop.proxyuser.hadoop.hosts</name>
    <value>*</value>
</property>
<property>
    <name>hadoop.proxyuser.hadoop.groups</name>
    <value>*</value>
</property>

b).启停HDFS

## 启动HDFS
./hadoop/sbin/start-dfs.sh

## 停止HDFS
./hadoop/sbin/stop-dfs.sh

c).HDFS退出安全模式

./hadoop/bin/hdfs dfsadmin -safemode leave

2.Hive

a).配置hive-site.xml

修改hive-site.xml中thrift相关配置项

## 配置host和port
<property>
    <name>hive.server2.thrift.port</name>
    <value>10000</value>
</property>

<property>
    <name>hive.server2.thrift.bind.host</name>
    <value>hostname</value>
</property>


## 访问权限
<property>
    <name>hive.scratch.dir.permission</name>
    <value>755</value>
</property>

b).启动

## 启动server2
./hive/bin/hive --service server2

## 启动thrift服务
./hive/bin/hive --service metastore -p 9083

3.Zeppline配置Hive Interpreter

a).创建Hive Interpreter

Interpreter Name: hive
Interpreter Group: jdbc

b).配置Hive Interpreter

hive.driver: org.apache.hive.jdbc.HiveDriver
hive.url: jdbc:hive2://hostname:10000
dependencies: hive-jdbc-.jar,hive-service-.jar,hadoop-common-.jar,protobuf-java-.jar

4.查询

show databases

use database

show tables

agg query

文章标签：

SQL

HIVE

Apache

分布式计算

Hadoop

Java

安全

数据库连接

关键词：

Apache查询

Apache hive

北斗云

目录

相关文章

SelectDB

|

SQL 存储 JSON

阿里云数据库 SelectDB 内核 Apache Doris 2.1.0 版本发布：开箱盲测性能大幅优化，复杂查询性能提升 100%

亲爱的社区小伙伴们，Apache Doris 2.1.0 版本已于 2024 年 3 月 8 日正式发布，新版本开箱盲测性能大幅优化，在复杂查询性能方面提升100%，新增Arrow Flight接口加速数据读取千倍，支持半结构化数据类型与分析函数。异步多表物化视图优化查询并助力仓库分层建模。引入自增列、自动分区等存储优化，提升实时写入效率。Workload Group 资源隔离强化及运行时监控功能升级，保障多负载场景下的稳定性。新版本已经上线，欢迎大家下载使用！

SelectDB

1415 1 2

阿里云数据库 SelectDB 内核 Apache Doris 2.1.0 版本发布：开箱盲测性能大幅优化，复杂查询性能提升 100%

xleesf

|

存储缓存分布式计算

Apache Hudi数据跳过技术加速查询高达50倍

Apache Hudi数据跳过技术加速查询高达50倍

xleesf

226 2 2

SelectDB

|

存储 SQL BI

毫秒级查询性能优化实践！基于阿里云数据库 SelectDB 版内核：Apache Doris 在极越汽车数字化运营和营销方向的解决方案

毫秒级查询性能优化实践！基于阿里云数据库 SelectDB 版内核：Apache Doris 在极越汽车数字化运营和营销方向的解决方案

SelectDB

2253 1 1

毫秒级查询性能优化实践！基于阿里云数据库 SelectDB 版内核：Apache Doris 在极越汽车数字化运营和营销方向的解决方案

SelectDB

|

存储 SQL 关系型数据库

拉卡拉 x Apache Doris：统一金融场景 OLAP 引擎，查询提速 15 倍，资源直降 52%

拉卡拉早期基于 Lambda 架构构建数据系统面临存储成本高、实时写入性能差、复杂查询耗时久、组件维护复杂等问题。为此，拉卡拉选择使用 Apache Doris 替换 Elasticsearch、Hive、Hbase、TiDB、Oracle / MySQL 等组件，实现了 OLAP 引擎的统一、查询性能提升 15 倍、资源减少 52% 的显著成效。

SelectDB

647 6 6

拉卡拉 x Apache Doris：统一金融场景 OLAP 引擎，查询提速 15 倍，资源直降 52%

SelectDB

|

存储 JSON 物联网

查询性能提升 10 倍、存储空间节省 65%，Apache Doris 半结构化数据分析方案及典型场景

本文我们将聚焦企业最普遍使用的 JSON 数据，分别介绍业界传统方案以及 Apache Doris 半结构化数据存储分析的三种方案，并通过图表直观展示这些方案的优势与不足。同时，结合具体应用场景，分享不同需求场景下的使用方式，帮助用户快速选择最合适的 JSON 数据存储及分析方案。

SelectDB

862 15 15

查询性能提升 10 倍、存储空间节省 65%，Apache Doris 半结构化数据分析方案及典型场景

SelectDB

|

存储消息中间件人工智能

AI大模型独角兽 MiniMax 基于阿里云数据库 SelectDB 版内核 Apache Doris 升级日志系统，PB 数据秒级查询响应

早期 MiniMax 基于 Grafana Loki 构建了日志系统，在资源消耗、写入性能及系统稳定性上都面临巨大的挑战。为此 MiniMax 开始寻找全新的日志系统方案，并基于阿里云数据库 SelectDB 版内核 Apache Doris 升级了日志系统，新系统已接入 MiniMax 内部所有业务线日志数据，数据规模为 PB 级，整体可用性达到 99.9% 以上，10 亿级日志数据的检索速度可实现秒级响应。

SelectDB

1075 14 14

AI大模型独角兽 MiniMax 基于阿里云数据库 SelectDB 版内核 Apache Doris 升级日志系统，PB 数据秒级查询响应

小Tomkk

|

SQL 分布式计算 Hadoop

Apache Hive 帮助文档

Apache Hive 帮助文档

小Tomkk

814 9 9

武子康

|

SQL 分布式计算 Hadoop

Hadoop-14-Hive HQL学习与测试表连接查询 HDFS数据导入导出等操作逻辑运算函数查询全表查询 WHERE GROUP BY ORDER BY（一）

Hadoop-14-Hive HQL学习与测试表连接查询 HDFS数据导入导出等操作逻辑运算函数查询全表查询 WHERE GROUP BY ORDER BY（一）

武子康

325 4 4

武子康

|

SQL

Hadoop-14-Hive HQL学习与测试表连接查询 HDFS数据导入导出等操作逻辑运算函数查询全表查询 WHERE GROUP BY ORDER BY（二）

Hadoop-14-Hive HQL学习与测试表连接查询 HDFS数据导入导出等操作逻辑运算函数查询全表查询 WHERE GROUP BY ORDER BY（二）

武子康

431 2 2

SelectDB

|

存储监控 Apache

查询提速11倍、资源节省70%，阿里云数据库内核版 Apache Doris 在网易日志和时序场景的实践

网易的灵犀办公和云信利用 Apache Doris 改进了大规模日志和时序数据处理，取代了 Elasticsearch 和 InfluxDB。Doris 实现了更低的服务器资源消耗和更高的查询性能，相比 Elasticsearch，查询速度提升至少 11 倍，存储资源节省达 70%。Doris 的列式存储、高压缩比和倒排索引等功能，优化了日志和时序数据的存储与分析，降低了存储成本并提高了查询效率。在灵犀办公和云信的实际应用中，Doris 显示出显著的性能优势，成功应对了数据增长带来的挑战。

SelectDB

53956 2 3

查询提速11倍、资源节省70%，阿里云数据库内核版 Apache Doris 在网易日志和时序场景的实践

热门文章

最新文章

使用Ranger对Hive数据进行脱敏

安装部署--hadoop、hive 配置修改&impala 配置 | 学习笔记

【Big Data】解决Hive查询出现Java.lang.OutMemoryError.java heap space

Hive SQL 迁移 Flink SQL 在快手的实践

Window10 pyhive连接hive报错：Could not start SASL: b‘Error in sasl_client_start (-4) SASL(-4)

CCAH-CCA-500-3题:Table schemas in Hive are?

Hive学习---4、函数（单行函数、高级聚合函数、炸裂函数、窗口函数）（一）

实战 | Hive 数据倾斜问题定位排查及解决（一）

【Hive SQL 每日一题】统计最近1天/7天/30天商品的销量

[Hive]Hive使用指南五客户端导出数据

基于阿里云数据库 SelectDB 内核 Apache Doris 的实时/离线一体化架构，赋能中国联通 5G 全连接工厂解决方案

活动预告｜6月13日Apache Flink Meetup·香港站

众安保险 CDP 平台：借助阿里云数据库 SelectDB 版内核 Apache Doris 打破数据孤岛，人群圈选提速4倍

云计算新宠：探索Apache Doris的云原生策略

HBase Shell-org.apache.hadoop.hbase.ipc.ServerNotRunningYetException: Server is not running yet 已解决

org.apache.hadoop.security.AccessControlException Permission denied: user=anonymous, access=WRITE...

org.apache.ibatis.binding.BindingException: Invalid bound statement (not found): com.example.forum.d

AutoMQ 生态集成 Apache Doris

Apache Flink CDC 3.1.0 发布公告

实时计算 Flink版操作报错之遇到错误org.apache.flink.table.api.ValidationException: Could not find any factory for identifier 'jdbc'，该如何解决

相关课程

更多

Apache RocketMQ：如何从互联网时代演进到云

Apache Flink 入门到实战 - Flink开源社区出品

大数据Hive教程精讲

Apache Flink 入门

相关电子书

更多

Hive Bucketing in Apache Spark

spark替代HIVE实现ETL作业

2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践

推荐镜像

更多

apache

下一篇

开通oss服务