在Hive中配置并启动HiveServer2服务-开发者社区-阿里云

[Hive]HiveServer2配置

2017-07-18 4628

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

日志服务 SLS，月写入数据量 50GB 1个月

简介： HiveServer2(HS2)是一个服务器接口，能使远程客户端执行Hive查询，并且可以检索结果。HiveServer2是HiveServer1的改进版，HiveServer1已经被废弃。

HiveServer2(HS2)是一个服务器接口，能使远程客户端执行Hive查询，并且可以检索结果。HiveServer2是HiveServer1的改进版，HiveServer1已经被废弃。HiveServer2可以支持多客户端并发和身份认证。旨在为开放API客户端（如JDBC和ODBC）提供更好的支持。

这篇文章将介绍如何配置服务器端。如何使用客户端与此服务器端交互将在下篇文章中介绍。

备注

Hive 0.11版本引入. See HIVE-2935.

1. 配置

1.1 hive-site.xml中配置

hive.server2.thrift.min.worker.threads – 最小工作线程, 默认为 5.
hive.server2.thrift.max.worker.threads – 最大工作线程, 默认为 500.
hive.server2.thrift.port – 监听的TCP端口号, 默认为 10000.
hive.server2.thrift.bind.host – 绑定的TCP接口.

其他的选项可以参考　HiveServer2 in the Configuration Properties document

1.2 可选环境设置

HIVE_SERVER2_THRIFT_BIND_HOST – 绑定到的TCP host接口(可选)。覆盖配置文件设置。
HIVE_SERVER2_THRIFT_PORT – 要监听的TCP端口号(可选)，默认为10000.覆盖配置文件设置。

1.3 HTTP模式运行

HiveServer2支持通过HTTP传输发送Thrift RPC消息（Hive 0.13版本开始，参见HIVE-4752）。这对于支持客户端和服务器之间需要代理时非常有用（例如，为了负载均衡或安全原因）。目前，可以在TCP模式或HTTP模式下运行HiveServer2，但不能同时运行HiveServer2。对于相应的JDBC URL，请参考：HiveServer2客户端 - JDBC连接URL。使用以下设置启用和配置HTTP模式：

设置	默认值	描述
hive.server2.transport.mode	binary	设置为http以启用HTTP传输模式
hive.server2.thrift.http.port	10001	需要监听的HTTP端口
hive.server2.thrift.http.max.worker.threads	500	最大工作线程
hive.server2.thrift.http.min.worker.threads	5	最小工作线程
hive.server2.thrift.http.path	cliservice	服务端点

1.4 可选的全局初始化文件

全局初始化文件可以放置在hive.server2.global.init.file.location在配置的位置（Hive 0.14开始版本，参见HIVE-5160，HIVE-7497和HIVE-8138）。这可以是初始化文件本身的路径，也可以是一个名为.hiverc的初始化文件目录。

初始化文件列出了将为此HiveServer2实例的用户运行的一组命令，例如注册一组标准的jar和函数。

1.5 日志记录配置

Beeline客户端可以获取HiveServer2操作日志（Hive 0.14开始版本）。配置日志记录一些参数如下：

hive.server2.logging.operation.enabled 默认为true，表示HiveServer2将为客户端保存操作日志
hive.server2.logging.operation.log.location　如果启用此功能，则存储操作日志到顶级目录中。
hive.server2.logging.operation.verbose (Hive 0.14 到 1.1)如果为true，则可以为客户端提供HiveServer2操作日志。 在Hive 1.2.0中替换为hive.server2.logging.operation.level。
hive.server2.logging.operation.level (Hive 1.2 开始版本) 可以设置HiveServer2操作日志级别

2. 如何开始

$HIVE_HOME/bin/hiveserver2

或者

$HIVE_HOME/bin/hive --service hiveserver2

2.1 使用信息

-H或--help选项显示使用消息，例如：

$HIVE_HOME/bin/hive --service hiveserver2 -H
Starting HiveServer2
usage: hiveserver2
 -H,--help                        Print help information
    --hiveconf <property=value>   Use value for given property

3. Web UI

备注

Hive 2.0.0版本引入．

HiveServer2的Web用户界面（UI）提供配置，日志记录，度量(metrics)和活动会话信息。默认情况下，Web UI可以在端口10002（127.0.0.1:10002）上使用。

可以在hive-site.xml中自定义Web UI的配置属性，其中包括hive.server2.webui.host，hive.server2.webui.port，hive.server2.webui.max.threads等。
Hive Metrics可以通过使用Metrics Dump选项卡查看。
可以使用本地日志选项卡查看日志。

该接口目前正在HIVE-12338上开发。

4. Python 客户端驱动程序

HiveServer2的Python客户端驱动程序可在https://github.com/BradRuderman/pyhs2 上获得（谢谢Brad）。它包括所有必需的软件包，如SASL和Thrift包装器(wrappers)。

该驱动程序已被认证可用于Python 2.6及更高版本。

要使用pyhs2驱动程序：

pip install pyhs2

然后：

import pyhs2

with pyhs2.connect(host='localhost',
                   port=10000,
                   authMechanism="PLAIN",
                   user='root',
                   password='test',
                   database='default') as conn:
    with conn.cursor() as cur:
        #Show databases
        print cur.getDatabases()

        #Execute query
        cur.execute("select * from table")

        #Return column info from query
        print cur.getSchema()

        #Fetch table results
        for i in cur.fetch():
            print i

原文：https://cwiki.apache.org/confluence/display/Hive/Setting+Up+HiveServer2

[Hive]HiveServer2配置

1. 配置

1.1 hive-site.xml中配置

1.2 可选环境设置

1.3 HTTP模式运行

1.4 可选的全局初始化文件

1.5 日志记录配置

2. 如何开始

2.1 使用信息

3. Web UI

4. Python 客户端驱动程序

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

[Hive]HiveServer2配置

1. 配置

1.1 hive-site.xml中配置

1.2 可选环境设置

1.3 HTTP模式运行

1.4 可选的全局初始化文件

1.5 日志记录配置

2. 如何开始

2.1 使用信息

3. Web UI

4. Python 客户端驱动程序

热门文章

最新文章

相关课程

相关电子书