大数据技术之Clickhouse---入门篇---安装

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 大数据技术之Clickhouse---入门篇---安装

                                                                                 

                       星光下的赶路人star的个人主页

                      知世故而不世故 是善良的成熟


文章目录



1、ClickHouse的安装


1.1 准备工作


1.1.1 确定防火墙处于关闭状态


1.1.2 CentOS取消打开文件数限制


1、在 hadoop102 的 /etc/security/limits.conf 文件的末尾加入以下内容

* soft nofile 65536
* hard nofile 65536
* soft nproc 131072
* hard nproc 131072

2、在 hadoop102 的/etc/security/limits.d/20-nproc.conf 文件的末尾加入以下内容

* soft nofile 65536
* hard nofile 65536
* soft nproc 131072
* hard nproc 131072

3、执行同步操作(和其他节点同步一下)


1.1.3 安装依赖(所有节点都进行依赖安装)

sudo yum install -y libtool
 sudo yum install -y *unixODBC*
• 1
• 2
• 3


1.1.4 CentOS取消SELINUX


1、修改/etc/selinux/config 中的 SELINUX=disabled

SELINUX=disabled
• 1


2、执行同步操作

3、重启三台服务器


1.2 单机安装


官网:https://clickhouse.tech/

下载地址:http://repo.red-soft.biz/repos/clickhouse/stable/el7/


1.2.1 在 hadoop102 的/opt/software 下创建 clickhouse 目录

mkdir clickhouse
• 1


1.2.2 将文件上传到hadoop102 的/opt/software下(文件下面链接自取)


链接:https://pan.baidu.com/s/1NDxqVy9j23emnYd6TnzuiA

提取码:zhm6


1.2.3 将安装文件同步到其他节点


1.2.4 分别在所有机子上安装这 4 个 rpm 文件

sudo rpm -ivh *.rpm
• 1

1.2.5 修改配置文件

sudo vim /etc/clickhouse-server/config.xml
• 1

1、把 <listen_host>::</listen_host> 的注释打开,这样的话才能让 ClickHouse 被除本

机以外的服务器访问。

2、分发配置文件

在这个文件中,有 ClickHouse 的一些默认路径配置,比较重要的

数据文件路径: /var/lib/clickhouse/

日志文件路径:/var/log/clickhouse-server/clickhouse-server.log


1.2.6 启动Server


sudo systemctl start clickhouse-server
• 1


1.2.7 所有机器上关闭开机自启


sudo systemctl disable clickhouse-server
• 1


1.2.8 使用Client连接Server


clickhouse-client -m
# -m :可以在命令窗口输入多行命令
• 1
• 2

                                                                                     

                                                                        您的支持是我创作的无限动力

                                                                                     

                      希望我能为您的未来尽绵薄之力

                                                                                     

                    如有错误,谢谢指正若有收获,谢谢赞美

相关文章
|
1月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
3天前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
19 2
|
23天前
|
存储 分布式计算 数据可视化
大数据常用技术与工具
【10月更文挑战第16天】
81 4
|
5天前
|
存储 分布式计算 NoSQL
【赵渝强老师】大数据技术的理论基础
本文介绍了大数据平台的核心思想,包括Google的三篇重要论文:Google文件系统(GFS)、MapReduce分布式计算模型和BigTable大表。这些论文奠定了大数据生态圈的技术基础,进而发展出了Hadoop、Spark和Flink等生态系统。文章详细解释了GFS的架构、MapReduce的计算过程以及BigTable的思想和HBase的实现。
|
1月前
|
存储 数据采集 监控
大数据技术:开启智能决策与创新服务的新纪元
【10月更文挑战第5天】大数据技术:开启智能决策与创新服务的新纪元
|
1月前
|
消息中间件 分布式计算 关系型数据库
大数据-140 - ClickHouse 集群 表引擎详解5 - MergeTree CollapsingMergeTree 与其他数据源 HDFS MySQL
大数据-140 - ClickHouse 集群 表引擎详解5 - MergeTree CollapsingMergeTree 与其他数据源 HDFS MySQL
44 0
|
5天前
|
SQL 存储 算法
比 SQL 快出数量级的大数据计算技术
SQL 是大数据计算中最常用的工具,但在实际应用中,SQL 经常跑得很慢,浪费大量硬件资源。例如,某银行的反洗钱计算在 11 节点的 Vertica 集群上跑了 1.5 小时,而用 SPL 重写后,单机只需 26 秒。类似地,电商漏斗运算和时空碰撞任务在使用 SPL 后,性能也大幅提升。这是因为 SQL 无法写出低复杂度的算法,而 SPL 提供了更强大的数据类型和基础运算,能够实现高效计算。
|
9天前
|
存储 大数据 定位技术
大数据 数据索引技术
【10月更文挑战第26天】
21 3
|
9天前
|
存储 大数据 OLAP
大数据数据分区技术
【10月更文挑战第26天】
31 2
|
11天前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
41 2