基于Docker搭建大数据集群(二)基础组件配置

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 基于Docker搭建大数据集群(二)基础组件配置
主要内容
  1. jdk环境搭建
  2. scala环境搭建
  3. zookeeper部署
  4. mysql部署
前提
  • docker容器之间能免密钥登录
  • yum源更换为阿里源
安装包

微云分享 | tar包目录下

  • JDK 1.8.221
  • Scala 2.12.9
  • Zookeeper 3.5.5
  • Mysql 手动安装较复杂,使用yum安装

一、安装包处理

发送文件到容器

docker cp 文件地址 容器ID:容器地址

创建解压目录

mkdir /opt/jdk
mkdir /opt/scala
mkdir /opt/zookeeper
mkdir /opt/mysql

解压文件

tar xivf tar包 -C /opt/对应目录

二、配置环境变量

编辑配置文件

root用户vim ~/.bash_profile非root用户只对当前用户生效vim /home/用户名/.bash_profile

追加以下内容
JAVA_HOME=/opt/jdk/jdk1.8.0_221
PATH=$PATH:$JAVA_HOME/bin
export JAVA_HOME
SCALA_HOME=/opt/scala/scala-2.12.9
PATH=$PATH:$SCALA_HOME/bin
export SCALA_HOME
ZK_HOME=/opt/zookeeper/apache-zookeeper-3.5.5-bin
PATH=$PATH:$ZK_HOME/bin
export ZK_HOME
使配置文件生效

root用户,对所有用户生效source ~/.bash_profile非root用户,只对当前用户生效source /home/用户名/.bash_profile

测试Java是否安装成功

java -version

测试scala是否安装成功

scala -version

三、zookeeper部署

zookeeper新的版本-bin的使编译后的包,与之前是反的。。得注意下

新建或复制zoo.cfg

cp zoo_sample.cfg zoo.cfg

追加以下内容
server.1=172.15.0.2:2888:3888
server.2=172.15.0.3:2888:3888
server.3=172.15.0.4:2888:3888
创建myid文件

zoo.cfg中有个dataDir属性,在后面的目录下面创建一个myid文件,内容就是当前节点号

172.16.0.2 --> 1

172.16.0.3 --> 2

172.16.0.4 --> 3

启动

zkServer.sh start

四、Mysql部署

下载官方yum Repository

wget -i -c http://dev.mysql.com/get/mysql57-community-release-el7-10.noarch.rpm

安装yum Repository

yum -y install mysql57-community-release-el7-10.noarch.rpm

安装mysql

yum -y install mysql-community-server

启动mysql

systemctl start mysqld.service

查看状态

systemctl status mysqld.service

获取默认密码

grep "password" /var/log/mysqld.log

登录

mysql -uroot -p

更改密码策略

set global validate_password_policy=0;set global validate_password_length=1;

修改密码

ALTER USER 'root'@'localhost' IDENTIFIED BY 'root';

设置可视化客户端连接

grant all on *.* to root@'%' identified by 'root';

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
23天前
|
消息中间件 监控 RocketMQ
Docker部署RocketMQ5.2.0集群
本文详细介绍了如何使用Docker和Docker Compose部署RocketMQ 5.2.0集群。通过创建配置文件、启动集群和验证容器状态,您可以快速搭建起一个RocketMQ集群环境。希望本文能够帮助您更好地理解和应用RocketMQ,提高消息中间件的部署和管理效率。
211 91
|
5月前
|
网络安全 Docker 容器
|
5月前
|
网络安全 Docker 容器
|
5月前
|
安全 Docker 容器
|
5月前
|
网络安全 数据安全/隐私保护 Docker
zdl
|
4月前
|
消息中间件 运维 大数据
大数据实时计算产品的对比测评:实时计算Flink版 VS 自建Flink集群
本文介绍了实时计算Flink版与自建Flink集群的对比,涵盖部署成本、性能表现、易用性和企业级能力等方面。实时计算Flink版作为全托管服务,显著降低了运维成本,提供了强大的集成能力和弹性扩展,特别适合中小型团队和业务波动大的场景。文中还提出了改进建议,并探讨了与其他产品的联动可能性。总结指出,实时计算Flink版在简化运维、降低成本和提升易用性方面表现出色,是大数据实时计算的优选方案。
zdl
229 56
|
4月前
|
SQL 数据采集 分布式计算
【赵渝强老师】基于大数据组件的平台架构
本文介绍了大数据平台的总体架构及各层的功能。大数据平台架构分为五层:数据源层、数据采集层、大数据平台层、数据仓库层和应用层。其中,大数据平台层为核心,负责数据的存储和计算,支持离线和实时数据处理。数据仓库层则基于大数据平台构建数据模型,应用层则利用这些模型实现具体的应用场景。文中还提供了Lambda和Kappa架构的视频讲解。
504 3
【赵渝强老师】基于大数据组件的平台架构
|
3月前
|
Prometheus 监控 Cloud Native
如何使用Prometheus监控Docker Swarm集群的资源使用情况?
还可以根据实际需求进行进一步的配置和优化,如设置告警规则,当资源使用超出阈值时及时发出警报。通过这些步骤,能够有效地使用 Prometheus 对 Docker Swarm 集群的资源进行监控和管理。
118 8
|
3月前
|
Prometheus 监控 Cloud Native
如何监控Docker Swarm集群的性能?
如何监控Docker Swarm集群的性能?
191 8
|
3月前
|
监控 Docker 容器
Docker Swarm集群的扩展与缩容策略,涵盖其意义、方法、步骤及注意事项
本文深入探讨了Docker Swarm集群的扩展与缩容策略,涵盖其意义、方法、步骤及注意事项,旨在帮助用户高效管理集群资源,适应业务变化,确保服务稳定性和资源优化。
96 6