大数据技术之Clickhouse---入门篇---安装

简介: 大数据技术之Clickhouse---入门篇---安装

                                                                                 

                       星光下的赶路人star的个人主页

                      知世故而不世故 是善良的成熟


文章目录



1、ClickHouse的安装


1.1 准备工作


1.1.1 确定防火墙处于关闭状态


1.1.2 CentOS取消打开文件数限制


1、在 hadoop102 的 /etc/security/limits.conf 文件的末尾加入以下内容

* soft nofile 65536
* hard nofile 65536
* soft nproc 131072
* hard nproc 131072

2、在 hadoop102 的/etc/security/limits.d/20-nproc.conf 文件的末尾加入以下内容

* soft nofile 65536
* hard nofile 65536
* soft nproc 131072
* hard nproc 131072

3、执行同步操作(和其他节点同步一下)


1.1.3 安装依赖(所有节点都进行依赖安装)

sudo yum install -y libtool
 sudo yum install -y *unixODBC*
• 1
• 2
• 3


1.1.4 CentOS取消SELINUX


1、修改/etc/selinux/config 中的 SELINUX=disabled

SELINUX=disabled
• 1


2、执行同步操作

3、重启三台服务器


1.2 单机安装


官网:https://clickhouse.tech/

下载地址:http://repo.red-soft.biz/repos/clickhouse/stable/el7/


1.2.1 在 hadoop102 的/opt/software 下创建 clickhouse 目录

mkdir clickhouse
• 1


1.2.2 将文件上传到hadoop102 的/opt/software下(文件下面链接自取)


链接:https://pan.baidu.com/s/1NDxqVy9j23emnYd6TnzuiA

提取码:zhm6


1.2.3 将安装文件同步到其他节点


1.2.4 分别在所有机子上安装这 4 个 rpm 文件

sudo rpm -ivh *.rpm
• 1

1.2.5 修改配置文件

sudo vim /etc/clickhouse-server/config.xml
• 1

1、把 <listen_host>::</listen_host> 的注释打开,这样的话才能让 ClickHouse 被除本

机以外的服务器访问。

2、分发配置文件

在这个文件中,有 ClickHouse 的一些默认路径配置,比较重要的

数据文件路径: /var/lib/clickhouse/

日志文件路径:/var/log/clickhouse-server/clickhouse-server.log


1.2.6 启动Server


sudo systemctl start clickhouse-server
• 1


1.2.7 所有机器上关闭开机自启


sudo systemctl disable clickhouse-server
• 1


1.2.8 使用Client连接Server


clickhouse-client -m
# -m :可以在命令窗口输入多行命令
• 1
• 2

                                                                                     

                                                                        您的支持是我创作的无限动力

                                                                                     

                      希望我能为您的未来尽绵薄之力

                                                                                     

                    如有错误,谢谢指正若有收获,谢谢赞美

相关文章
|
2月前
|
Cloud Native 数据处理 云计算
探索云原生技术在大数据分析中的应用
随着云计算技术的不断发展,云原生架构作为一种全新的软件开发和部署模式,正逐渐引起企业的广泛关注。本文将探讨云原生技术在大数据分析领域的应用,介绍其优势与挑战,并探讨如何利用云原生技术提升大数据分析的效率和可靠性。
|
1月前
|
分布式计算 Hadoop 大数据
大数据技术与Python:结合Spark和Hadoop进行分布式计算
【4月更文挑战第12天】本文介绍了大数据技术及其4V特性,阐述了Hadoop和Spark在大数据处理中的作用。Hadoop提供分布式文件系统和MapReduce,Spark则为内存计算提供快速处理能力。通过Python结合Spark和Hadoop,可在分布式环境中进行数据处理和分析。文章详细讲解了如何配置Python环境、安装Spark和Hadoop,以及使用Python编写和提交代码到集群进行计算。掌握这些技能有助于应对大数据挑战。
|
1月前
|
存储 数据采集 数据可视化
大数据处理技术
【4月更文挑战第10天】大数据处理涵盖采集、预处理、存储、分析挖掘、展现和应用等关键步骤。采集涉及多种类型数据,预处理确保数据质量,存储管理关注规模、速度和安全,分析挖掘利用机器学习发现价值,展现和应用则通过可视化和检索实现数据价值。云计算和AI强化了大数据处理能力,整体目标是提取数据中的价值,驱动企业和社会进步。
35 4
大数据处理技术
|
6天前
|
机器学习/深度学习 运维 算法
大数据基础工程技术团队4篇论文入选ICLR,ICDE,WWW
近日,由阿里云计算平台大数据基础工程技术团队主导的四篇时间序列相关论文分别被国际顶会ICLR2024、ICDE2024和WWW2024接收。
|
11天前
|
存储 机器学习/深度学习 数据采集
大数据处理与分析实战:技术深度剖析与案例分享
【5月更文挑战第2天】本文探讨了大数据处理与分析的关键环节,包括数据采集、预处理、存储、分析和可视化,并介绍了Hadoop、Spark和机器学习等核心技术。通过电商推荐系统和智慧城市交通管理的实战案例,展示了大数据在提高用户体验和解决实际问题上的效能。随着技术进步,大数据处理与分析将在更多领域发挥作用,推动社会进步。
|
19天前
|
分布式计算 Hadoop 大数据
[大数据] mac 史上最简单 hadoop 安装过程
[大数据] mac 史上最简单 hadoop 安装过程
|
19天前
|
分布式计算 大数据 数据处理
[AIGC大数据基础] Spark 入门
[AIGC大数据基础] Spark 入门
141 0
|
23天前
|
存储 数据可视化 大数据
大数据技术框架
【4月更文挑战第20天】大数据一般需要经过6个主要环节,包括数据收集、数据存储、资源管理与服务协调、计算引擎、数据分析和数据可视化。
|
1月前
|
Ubuntu Python
python3安装clickhouse_sqlalchemy(greenlet) 失败
如果上述方法仍然无法解决问题,建议查阅相关错误信息和官方文档,以获取更详细的帮助。确保你的Python环境和依赖库都在最新版本,有时问题可能会因为版本不兼容而导致安装失败。
26 0
|
1月前
|
存储 大数据 数据管理
大数据技术是如何发展的?
大数据虽已发展多年,但仍面临将恰当信息在正确时间传递给合适人员的挑战。尽管技术进步,大部分企业员工仍难以获取所需信息。数据仓库、数据湖和数据结构等存储系统涌现,但集中数据并不实际,数据去中心化趋势明显。数据结构允许异构数据并促进治理,同时,云计算影响大数据战略,提供灵活实验空间。数据治理和隐私规则的遵守至关重要,流程成熟度聚焦于数据质量和共享。目前大数据正处于“幻灭低谷”,成功的关键在于数据治理和处理流程的改进。

热门文章

最新文章