apache tez 编译安装与验证

简介: 本文介绍apache tez 编译安装与验证

基本介绍

Apache Tez是构建于Apache Hadoop YARN上,基于有向无环图进行数据处理的框架。

主要设计主题:

  • 授权终端用户

    • 表达性数据流定义API
    • 灵活的输入处理输出运行模型
    • 数据类型无关
    • 极易部署
  • 执行性能

    • 优于mapreduce
    • 优化资源管理
    • 运行时计划重新配置
    • 动态物理数据流决策

通过允许像Apache Hive和Apache Pig这样的项目运行复杂的DAG任务,Tez可以用来处理数据,以前需要多个MR任务,现在只需要一个Tez任务,如下所示。

下载地址

https://tez.apache.org/releases/index.html

安装部署

版本适配

对于Tez版本0.8.3和更高,Tez需要Apache Hadoop版本2.6.0或更高。对于Tez版本0.9.0及更高版本,Tez需要Apache Hadoop版本2.7.0或更高。所以说,我们在选用tez时,是需要先确定我们的hadoop版本的。

适配hadoop版本进行tez源码编译

编译平台

操作系统:centos 7.6

CPU架构:x86_64

依赖安装

  1. 首先确保已经安装
  • jdk8
  • maven3
  1. protobuf-2.5.0安装
yum install protobuf protobuf-devel

源码编译

在确定我们使用的hadoop版本之后,选择合适的tez进行源码编译。这边以

  • tez-0.9.2
  • hadoop-3.2.0

为例对tez进行源码编译。

  1. 源码下载与解压
wget https://mirror.olnevhost.net/pub/apache/tez/0.9.2/apache-tez-0.9.2-src.tar.gz
tar zxvf apache-tez-0.9.2-src.tar.gz
  1. 源码编译
cd apache-tez-0.9.2-src && mvn clean package -Dtar -Dhadoop.version=3.2.0 -DskipTests

编译完成之后,得到tez-dist/target/tez-0.9.2.tar.gz

功能测试

首先确保hadoop正常安装,包括hdfs和yarn

参考:如何安装hadoop yarn

将tez-0.9.2.tar.gz上传到hdfs的/app/tez目录

hdfs dfs -put tez-0.9.2.tar.gz /app/tez/

新建tez目录,并将tez-0.9.2.tar.gz复制到tez钟

mkdir -p /data/tez/conf
cp tez-0.9.2.tar.gz /data/tez
cd /data/tez && tar zvf tez-0.9.2.tar.gz

新建tez-site.xml,内容如下

<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!--
  Licensed under the Apache License, Version 2.0 (the "License");
  you may not use this file except in compliance with the License.
  You may obtain a copy of the License at

    http://www.apache.org/licenses/LICENSE-2.0

  Unless required by applicable law or agreed to in writing, software
  distributed under the License is distributed on an "AS IS" BASIS,
  WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  See the License for the specific language governing permissions and
  limitations under the License. See accompanying LICENSE file.
-->

<configuration>
<property>
<name>tez.lib.uris</name>
<value>/app/tez/tez-0.9.2.tar.gz</value>
</property>
</configuration>

修改/etc/profile,新增

export TEZ_CONF_DIR=/data/tez/conf
export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:$TEZ_CONF_DIR:/data/tez/*:/data/tez/lib/*

修改mapred-site.xml,将

  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>

改为

  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>

执行测试脚本:

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.0.jar wordcount /test/ output-1

得到结果:

相关文章
|
11月前
|
Linux Apache
百度搜索:蓝易云【Cnetos7编译安装Apache教程。】
现在,您已经成功在CentOS 7上通过编译安装了Apache。请注意,以上步骤提供了基本的指导,实际操作可能会有所差异。如有需要,您可以参考Apache官方文档或社区资源获取更详细的信息和帮助。
69 0
|
11月前
|
Linux Apache 开发工具
百度搜索:蓝易云【Centos8 stream系统编译安装Apache教程。】
以上是在CentOS 8 Stream系统上编译安装Apache的基本教程。请注意,具体的配置和参数可能因您的需求而有所不同,您可以根据自己的情况进行调整。同时,请确保在执行任何操作之前备份重要的文件和配置。
397 0
|
11月前
|
SQL 分布式计算 测试技术
从 Clickhouse 到阿里云数据库 SelectDB 版内核 Apache Doris:有赞业务场景下性能测试与迁移验证
从 Clickhouse 到阿里云数据库 SelectDB 版内核 Apache Doris 迁移实践:有赞查询提速近 10 倍,OLAP 分析更实时高效!
从 Clickhouse 到阿里云数据库 SelectDB 版内核 Apache Doris:有赞业务场景下性能测试与迁移验证
|
11月前
|
Ubuntu Apache
百度搜索:蓝易云【Ubuntu 18.04系统编译安装Apache教程。】
现在,您已经成功地在Ubuntu 18.04上编译和安装了Apache。您可以通过在浏览器中访问服务器的IP地址来验证Apache是否正常运行。请确保在实际操作中根据您的需求进行适当的配置和调整。请注意,通过编译安装方式安装的Apache不会自动更新,您需要手动更新版本或进行维护。
103 1
|
11月前
|
SQL 分布式计算 测试技术
从 Clickhouse 到 Apache Doris:有赞业务场景下性能测试与迁移验证
当前,电商运营的主要痛点不仅来自多变的市场和客户需求,也受困于碎片化用户触达等带来的竞争与挑战。为了深度挖掘用户价值、培养用户忠诚度、实现业绩增长,有赞为商家搭建了全方位 OLAP 分析系统,提供实时与离线分析报表、智能营销与人群圈选等 SaaS 服务。本文将详细介绍有赞从 Clickhouse 至 Apache Doris 的迁移规划和性能对比测试实践,分享如何基于 Apache Doris 统一 OLAP 技术栈,并满足庞大数据体量下的实时分析与极速查询,最终有赞在多个场景下实现查询平均提速 200% 。
308 0
|
11月前
|
Ubuntu Apache
百度搜索:蓝易云【Ubuntu 20.04系统编译安装Apache教程。】
请注意,以上是一个基本的编译安装Apache的示例,您可能需要根据您的特定需求进行进一步配置和调整。
71 0
|
11月前
|
Apache
百度搜索:蓝易云【Debian11系统编译安装Apache教程。】
以上是在Debian 11系统上编译安装Apache的基本步骤。请根据实际情况进行相应的调整和配置。
82 0
|
安全 Linux API
​Apache Solr未授权上传漏洞复现及验证POC编写
​Apache Solr未授权上传漏洞复现及验证POC编写
|
Apache 开发工具
编译安装apache
编译安装apache
|
Java 应用服务中间件 Linux
Apache HTTP服务器(Linux离线编译安装)
Apache HTTP服务器(Linux离线编译安装)
Apache HTTP服务器(Linux离线编译安装)