大数据技术之Clickhouse---入门篇---安装

简介: 大数据技术之Clickhouse---入门篇---安装

                                                                                 

                       星光下的赶路人star的个人主页

                      知世故而不世故 是善良的成熟


文章目录



1、ClickHouse的安装


1.1 准备工作


1.1.1 确定防火墙处于关闭状态


1.1.2 CentOS取消打开文件数限制


1、在 hadoop102 的 /etc/security/limits.conf 文件的末尾加入以下内容

* soft nofile 65536
* hard nofile 65536
* soft nproc 131072
* hard nproc 131072

2、在 hadoop102 的/etc/security/limits.d/20-nproc.conf 文件的末尾加入以下内容

* soft nofile 65536
* hard nofile 65536
* soft nproc 131072
* hard nproc 131072

3、执行同步操作(和其他节点同步一下)


1.1.3 安装依赖(所有节点都进行依赖安装)

sudo yum install -y libtool
 sudo yum install -y *unixODBC*
• 1
• 2
• 3


1.1.4 CentOS取消SELINUX


1、修改/etc/selinux/config 中的 SELINUX=disabled

SELINUX=disabled
• 1


2、执行同步操作

3、重启三台服务器


1.2 单机安装


官网:https://clickhouse.tech/

下载地址:http://repo.red-soft.biz/repos/clickhouse/stable/el7/


1.2.1 在 hadoop102 的/opt/software 下创建 clickhouse 目录

mkdir clickhouse
• 1


1.2.2 将文件上传到hadoop102 的/opt/software下(文件下面链接自取)


链接:https://pan.baidu.com/s/1NDxqVy9j23emnYd6TnzuiA

提取码:zhm6


1.2.3 将安装文件同步到其他节点


1.2.4 分别在所有机子上安装这 4 个 rpm 文件

sudo rpm -ivh *.rpm
• 1

1.2.5 修改配置文件

sudo vim /etc/clickhouse-server/config.xml
• 1

1、把 <listen_host>::</listen_host> 的注释打开,这样的话才能让 ClickHouse 被除本

机以外的服务器访问。

2、分发配置文件

在这个文件中,有 ClickHouse 的一些默认路径配置,比较重要的

数据文件路径: /var/lib/clickhouse/

日志文件路径:/var/log/clickhouse-server/clickhouse-server.log


1.2.6 启动Server


sudo systemctl start clickhouse-server
• 1


1.2.7 所有机器上关闭开机自启


sudo systemctl disable clickhouse-server
• 1


1.2.8 使用Client连接Server


clickhouse-client -m
# -m :可以在命令窗口输入多行命令
• 1
• 2

                                                                                     

                                                                        您的支持是我创作的无限动力

                                                                                     

                      希望我能为您的未来尽绵薄之力

                                                                                     

                    如有错误,谢谢指正若有收获,谢谢赞美

相关文章
|
分布式计算 大数据 Apache
ClickHouse与大数据生态集成:Spark & Flink 实战
【10月更文挑战第26天】在当今这个数据爆炸的时代,能够高效地处理和分析海量数据成为了企业和组织提升竞争力的关键。作为一款高性能的列式数据库系统,ClickHouse 在大数据分析领域展现出了卓越的能力。然而,为了充分利用ClickHouse的优势,将其与现有的大数据处理框架(如Apache Spark和Apache Flink)进行集成变得尤为重要。本文将从我个人的角度出发,探讨如何通过这些技术的结合,实现对大规模数据的实时处理和分析。
1037 2
ClickHouse与大数据生态集成:Spark & Flink 实战
|
7月前
|
数据采集 分布式计算 大数据
不会Python,还敢说搞大数据?一文带你入门大数据编程的“硬核”真相
不会Python,还敢说搞大数据?一文带你入门大数据编程的“硬核”真相
166 1
|
6月前
|
SQL 分布式计算 大数据
SparkSQL 入门指南:小白也能懂的大数据 SQL 处理神器
在大数据处理的领域,SparkSQL 是一种非常强大的工具,它可以让开发人员以 SQL 的方式处理和查询大规模数据集。SparkSQL 集成了 SQL 查询引擎和 Spark 的分布式计算引擎,使得我们可以在分布式环境下执行 SQL 查询,并能利用 Spark 的强大计算能力进行数据分析。
|
10月前
|
数据采集 数据可视化 大数据
Python入门修炼:开启你在大数据世界的第一个脚本
Python入门修炼:开启你在大数据世界的第一个脚本
201 6
|
存储 监控 数据挖掘
【Clikhouse 探秘】ClickHouse 物化视图:加速大数据分析的新利器
ClickHouse 的物化视图是一种特殊表,通过预先计算并存储查询结果,显著提高查询性能,减少资源消耗,适用于实时报表、日志分析、用户行为分析、金融数据分析和物联网数据分析等场景。物化视图的创建、数据插入、更新和一致性保证通过事务机制实现。
1726 14
|
存储 SQL Docker
ClickHouse入门指南:快速搭建与使用
【10月更文挑战第26天】在大数据时代,如何高效地处理海量数据成为了许多企业和开发者的关注点。ClickHouse 是一个开源的列式数据库管理系统(Column-Oriented DBMS),以其出色的查询性能和高并发能力,在数据分析领域迅速崛起。本文将从一个初学者的角度出发,详细介绍如何快速上手 ClickHouse,涵盖从环境搭建到基础操作的全过程。
1833 3
|
分布式计算 大数据 BI
ClickHouse与大数据生态整合:从ETL到BI报表
【10月更文挑战第27天】在这个数据驱动的时代,企业越来越依赖于数据来做出关键决策。而高效的数据处理和分析能力则是支撑这一需求的基础。作为一位数据工程师,我有幸参与到一个项目中,该项目旨在利用ClickHouse与Hadoop、Spark、Flink等大数据处理框架的整合,构建一个从数据提取(Extract)、转换(Transform)、加载(Load)到最终生成商业智能(BI)报表的全流程解决方案。以下是我在这个项目中的经验和思考。
630 1
|
数据可视化 数据挖掘 Docker
Docker Desktop 安装 ClickHouse 超级简单教程
Docker Desktop 安装 ClickHouse 超级简单教程
899 1
|
存储 监控 物联网
【Clickhouse 探秘】Clickhouse 投影技术到底能做什么?怎么实现的?
ClickHouse 投影是一种数据结构,用于提高特定查询模式下的性能。通过预处理数据,投影可以显著减少查询的执行时间,特别是在复杂的聚合和排序查询中。投影自动与基础表数据保持同步,支持多投影,适用于实时分析、用户行为分析、日志分析等场景。虽然投影能显著提升查询性能,但也会增加存储开销和写入性能的影响。
525 0
|
SQL 消息中间件 分布式计算
大数据-143 - ClickHouse 集群 SQL 超详细实践记录!(一)
大数据-143 - ClickHouse 集群 SQL 超详细实践记录!(一)
514 0

推荐镜像

更多