集群分类与集群常见问题

本文涉及的产品
传统型负载均衡 CLB,每月750个小时 15LCU
应用型负载均衡 ALB,每月750个小时 15LCU
网络型负载均衡 NLB,每月750个小时 15LCU
简介: 整理自《大话RAC》001 集群分类     高性能计算集群:应用在科学计算领域,常见于科研机构。     负载均衡集群(LB):核心是把业务的负载流量尽可能平均合理地分摊到集群各个节点。
整理自《大话RAC》

001  集群分类
    高性能计算集群:应用在科学计算领域,常见于科研机构。
    负载均衡集群(LB):核心是把业务的负载流量尽可能平均合理地分摊到集群各个节点。
    高可用集群(HA):侧重于系统可用性,通过集成硬件和软件的容错性来实现整体服务的高可用。如果集群中的某个节点发生了故障,那么将由另外的节点代替它。即使多个节点发生故障,整个系统环境也能保证用户能够访问。
    在实际应用的集群系统中,HA和LB这两种基本类型经常会发生混合与交杂。RAC就同时遇有HA和LB两种能力。

002 集群环境的特殊问题

    并发控制:Oracle RAC中用DLM(Distribute Lock Management)机制来进行多个实例间的并发控制。
 
    健忘症(Amnesia):这个问题发生在集群环境配置文件不是集中存放,而是每个节点都有一个本地副本。在集群正常运行时,用户可以在任何节点更改集群的配置,并且这种更改会自动同步到其它节点。
    但考虑这样一种场景:两个节点的集群,节点1因为正常的维护需要被关闭,然后在节点2修改了某些配置,然后关闭节点2(不关闭是什么情况??),启动节点1。因为之前在节点2做的配置修改没有同步到节点1,所以节点1启动后,它仍然是用旧的配置文件工作,这时就会造成配置丢失,即“健忘”。

    脑裂(split brain)
    在集群里,节点间需要通过某种机制(心跳)了解彼此的健康状况,以确保各节点协调工作。假设只是“心跳”出现故障,但各个节点还在正常运行。这时,每个节点都认为其它节点宕机。自己是整个集群环境中的“唯一健在者”,自己应该获得整个集群的“控制权”。在集群环境中,存储设备都是共享的,这就意味着数据灾难,这样一种情况是就是“脑裂”。

    IO隔离(IO fencing)
    这是脑裂的延伸。光节点被赶出集群还不够,还必须保证被赶出集群的节点不能操作共享数据。因为这时该节点可能还在运行中,如果不加限制很有可能会修改共享数据。这就是IO隔离要解决的问题。
    有硬件和软件两种方式:软件是自杀,硬件是他杀。
相关实践学习
SLB负载均衡实践
本场景通过使用阿里云负载均衡 SLB 以及对负载均衡 SLB 后端服务器 ECS 的权重进行修改,快速解决服务器响应速度慢的问题
负载均衡入门与产品使用指南
负载均衡(Server Load Balancer)是对多台云服务器进行流量分发的负载均衡服务,可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。 本课程主要介绍负载均衡的相关技术以及阿里云负载均衡产品的使用方法。
相关文章
|
7月前
|
分布式计算 DataWorks 关系型数据库
DataWorks操作报错合集之在DataWorks中设置了一个任务节点的调度时间,并将其发布到生产环境,但到了指定时间(例如17:30)却没有产生运行实例和相关日志如何解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
110 0
|
4月前
|
消息中间件 SQL DataWorks
DataWorks产品使用合集之节点冻结后还是发送基线告警,该如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
DataWorks产品使用合集之节点冻结后还是发送基线告警,该如何解决
|
4月前
|
存储 Kubernetes 监控
在K8S中,集群可以做哪些优化?
在K8S中,集群可以做哪些优化?
|
6月前
|
DataWorks 大数据 定位技术
DataWorks产品使用合集之如何查看每天调度任务节点的计算量
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
62 1
|
6月前
|
弹性计算 分布式计算 DataWorks
DataWorks产品使用合集之在脚本离线同步节点如何修改集成资源组
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
6月前
|
SQL 数据采集 DataWorks
DataWorks操作报错合集之数据集成里面的数据调度独享资源组测试通过了,但是数据地图里无法通过,该如何解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
7月前
|
数据采集 DataWorks 调度
DataWorks产品使用合集之Dataworks中在上游节点失败时仍然继续运行业务节点配置如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
51 0
|
7月前
|
分布式计算 DataWorks 监控
Dataphin常见问题之生产环境任务无法下线如何解决
Dataphin是阿里云提供的一站式数据处理服务,旨在帮助企业构建一体化的智能数据处理平台。Dataphin整合了数据建模、数据处理、数据开发、数据服务等多个功能,支持企业更高效地进行数据治理和分析。
|
7月前
|
SQL 分布式计算 DataWorks
DataWorks操作报错合集之在 DataWorks 中,出现上游节点绿色而下游节点灰色的情况如何解决
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
|
Docker 索引 容器
Elastic实战: 集群报黄如何处理
集群的有三种状态: 绿色:正常状态,表示主副分片都正常 黄色:主分片正常,至少一个副本分片不可用,该状态下仍然可以正常查询 红色:至少一个主分片不可用,可以查询到部分数据,但是数据不具备完整性
128 0
Elastic实战: 集群报黄如何处理