• Redis的KEYS命令引起RDS数据库雪崩,RDS发生两次宕机,...

    但是下面的原因也是一部分可能引起宕机的情况。某服务化项目的业务增速非常快&xff0c;在高峰期&xff0c;数据库QPS突破35000&xff0c;系统处于高负荷状态。在高峰期如果同时执行几个全表扫描的SQL&xff0c;会造成数据库压力...
    文章 2022-04-17 43浏览量
  • Skylake全新架构 杰和推高端数字标牌御用新品

    同时杰和D360支持无人值守主动管理技术(JAHC),可实现红外遥控开关机、上电自动开机、定时开关机、宕机自动重启,降低管理成本,提高工作效率。杰和D360凭借强劲的软硬件支持,使得其应用场景更为广泛,再融合杰和...
    文章 2017-08-02 1381浏览量
  • 大规模分布式系统问题集及解决方案(学习)

    为了避免单点问题,slave应该具备识别master宕机的能力。异步模式下,master本身就是单点(slave节点需要连接master,交换状态),master宕机,slave可知。强同步模式下,master和slave地位平等,区别只在于master提供...
    文章 2017-11-12 908浏览量
  • 关于Kubernetes规划的灵魂n问

    大多数企业在初始阶段采用将容器运行在虚拟机的方案,但是当大规模生产部署的时候,客户希望直接运行在裸金属服务器上来减少虚拟化技术的license成本(这也常被戏称为“VMWare税”)。还有近30%的客户因为在物理机上...
    文章 2020-01-31 750浏览量
  • 关于Kubernetes规划的灵魂n问

    大多数企业在初始阶段采用将容器运行在虚拟机的方案,但是当大规模生产部署的时候,客户希望直接运行在裸金属服务器上来减少虚拟化技术的license成本(这也常被戏称为“VMWare税”)。还有近30%的客户因为在物理机上...
    文章 2020-02-05 2272浏览量
  • 关于Kubernetes规划的灵魂n问

    大多数企业在初始阶段采用将容器运行在虚拟机的方案,但是当大规模生产部署的时候,客户希望直接运行在裸金属服务器上来减少虚拟化技术的license成本(这也常被戏称为“VMWare税”)。还有近30%的客户因为在物理机上...
    文章 2020-02-05 3562浏览量
  • 在ESXi主机上关闭无响应的虚拟

    如果你是对除了有问题的虚拟机以外的虚拟机进行这些操作,那么极有可能引起这些机器宕机。3.如果 vmx 进程在列表中,使用如下命令即可终止该进程:kill ProcessID 4.等待30秒然后重复步骤2来检查进程是否已终止。...
    文章 2017-11-05 1640浏览量
  • Learn Jenkins the hard way(0)-Jenkins的罪与罚

    `Jenkins Master在CJOC中是成对存在的,两个Master会通过共享存储的方式同步元数据信息,通过haproxy将两个节点挂载到一个虚拟IP下,当一个Jenkins Master宕机的时候,会再另外一台机器上启动起Jenkins Master实现宕...
    文章 2017-02-21 6880浏览量
  • 拯救者Linux:我是如何给我的团队引入Linux的

    没有人知道服务器不停宕机的原因,我们已经预期这个问题现在是无解的。我们是要采取一些措施来搞定这个问题,但是怎么做呢?以下是我们讨论得出的方法: 是否需要切换新的平台?IBM 当时引入了 Linux,给它的 Java 和 ...
    文章 2017-08-08 1359浏览量
  • 国产化新出路:中国服务器市场变形记

    RAS 2.0技术使产品在安全性上变被动为主动,可靠性达到99.9996%(年计划外理论宕机时间少于2分钟)。华为kunlun RAS2.0技术 不同于以往的小型机的RISC架构,华为KunLun采用了X86处理器,打破了传统小型机其上层软件...
    文章 2017-07-05 2726浏览量
  • 节约服务器成本50%以上,独角兽完美日记电商系统容器...

    服务器宕机时,服务器上运行的服务模块会自动转移到可用服务器上,无需人工干预,工作量减少100%。2、容器化改造更大的挑战是在技术和人员上做好准备 当企业完成了容器化改造之后,在生产环境中应用容器技术,并计划...
    文章 2020-07-09 1951浏览量
  • 节约服务器成本50%以上,独角兽完美日记电商系统容器...

    服务器宕机时,服务器上运行的服务模块会自动转移到可用服务器上,无需人工干预,工作量减少100%。2、容器化改造更大的挑战是在技术和人员上做好准备 当企业完成了容器化改造之后,在生产环境中应用容器技术,并计划...
    文章 2020-07-10 2477浏览量
  • 异数OS 2017 DPDK 峰会观后感

    VM网卡断了间隔怎样处理,OVS本身并没有解决方案,难以热迁移,这其实是没有直接解决方案的,而且仅仅是一个大类问题的一个小问题,本质问题是VM网卡断了VM中的OS协议栈以及应用可能会面临雪崩和应用宕机,这个问题...
    文章 2017-06-28 1706浏览量
  • 浅谈基于 OpenStack 和 k8s 建设云原生研发基础设施

    虚拟化技术提高了物理机的资源利用率,可以更容易地安装或更新应用程序,降低了硬件成本,因此可以更好地规模化实施。每一个虚拟机可以认为是被虚拟化的物理机之上的一台完整的机器,其中运行了一台机器的所有组件,...
    文章 2021-12-16 559浏览量
  • 400+节点的 Elasticsearch 集群运维

    不幸的是,当集群宕机的时候,不到三分之一的查询能成功完成。我们相信测试本身导致了集群宕机。—— 摘录自使用真实查询在新ES集群平台上的第一次性能测试 为了控制查询执行过程,我们开发了一个插件,实现了一系列...
    文章 2019-03-12 1088浏览量
  • 困知,勉行-阿里云服务观

    10月16日,面对现场8000余位开发者,阿里云技术领军者飞天负责人唐洪、技术保障负责人刘振飞、产品负责人张东晖直面阿里云在服务上出现的问题,并分别从技术、运维安全保障、产品等维度坦率地讲述发生问题的原因所在...
    文章 2016-12-25 3613浏览量
  • B 站挂了,聊聊高可用和异地多活

    如果按照日故障时间来算,只能达到两个九的标准,也就是 99%的高可用性,有点惨.3.4 一个九和两个九非常容易达到,一个正常的线上系统不会每天宕机 15 分钟吧,不然真用不下去了。3.5 三个就和四个九允许故障的时间...
    文章 2022-05-08 34浏览量
  • 400+节点的 Elasticsearch 集群运维

    不幸的是,当集群宕机的时候,不到三分之一的查询能成功完成。我们相信测试本身导致了集群宕机。—— 摘录自使用真实查询在新ES集群平台上的第一次性能测试 为了控制查询执行过程,我们开发了一个插件,实现了一系列...
    文章 2019-04-18 1926浏览量
  • 为什么 K8s 在阿里能成功?问底中国 IT 技术演进

    导读:本文描述了阿里巴巴在容器管理领域的技术演进历程,解读了为什么 K8s 最终能够大获成功的原因,以及到今年 双11 阿里巴巴内部的 K8s 应用情况。内容着重描述了阿里巴巴基于 K8s 的云原生改造实践过程的三大...
    文章 2020-01-21 1752浏览量
  • Apache Flink 在快手的过去、现在和未来

    宕机快速发现方面,我们研发了 Hawk Service,它是一个多数派的连通性检测服务,具体的检测流程是 Hawk 集群中多个工作节点会周期性地检测集群中每台机器的连通性,由于它是多数派的,所以可信度是有保障的。...
    文章 2021-02-26 1238浏览量
  • 阿里云基础产品技术月刊 2019年2月

    通过Blink实时流计算平台,已经在Blink平台上完成了内存故障预测模型的搭建,并打通数据反馈路径并将预测宕机的相关结果回流到阿里云日志服务(SLS)的日志中。后续计划和ECS的调度系统打通,增加系统中宕机风险的...
    文章 2019-03-13 3169浏览量
  • 搞懂分布式技术21:浅谈分布式消息技术 Kafka

    kafka在0.8版本前没有提供Partition的Replication机制,一旦Broker宕机,其上的所有Partition就都无法提供服务,而Partition又没有备份数据,数据的可用性就大大降低了。所以0.8后提供了Replication机制来保证Broker...
    文章 2018-07-05 1472浏览量
  • 十问|关于Service Mesh 和Kubernets的最前沿思考

    另外,因为中间件相比应用来说,会有更多的状态,而且也有不同的系统角色,在处理不同角色的扩容或是宕机恢复的时候,也需要考虑更多状态信息。以前每个中间件基本上是自己要在 PaaS 上去定制这部分的逻辑,复杂度和...
    文章 2018-07-24 2097浏览量
  • 流量暴增,掌门教育如何基于 Spring Cloud Alibaba ...

    节点宕机:其中某个节点宕机,其任务转移到其它节点,因为有虚拟节点的缘已经故,所以此节点的任务会均衡 ReSharding 到其它节点,那么,集群在任何时候,任务处理都是分片均衡的,如上图 2 中,B 节点宕机,#1、#2 ...
    文章 2020-09-10 968浏览量
  • 两万字深度介绍分布式系统原理

    一台宕机的机器恢复的时间通常认为是24 小时&xff0c;一般需要人工介入重启机器。网络异常&xff1a;消息丢失&xff0c;两片节点之间彼此完全无法通信&xff0c;即出现了“网络分化”&xff1b;消息乱序&xff0c;有一定的概率不是...
    文章 2022-01-15 30浏览量
  • 【MOS】RAC 环境中 gc block lost 和私网通信性能问题...

    描述:配置主机防火墙或网络地址转换(NAT)软件-IPFILTER(IPF)也是导致私网通信问题的原因之一。IPF还会导致严重的应用程序性能下降,丢包以及global cache block loss问题.解决:禁用 IPFILTER ...
    文章 2017-06-24 1697浏览量
  • 使用阿里云学习Redis

    限制LIMITSmaxclients最大客户端的数量,默认没有设置maxmemory建议必须设置,内存占满会宕机设置可同内存量,一旦达到上限,redis会移除部分数据,根据maxmemory-policy来指定maxmemory-policymaxmemory-samples...
    文章 2022-02-27 65浏览量
  • 读书笔记 之《软件架构设计:大型网站技术架构与业务...

    一个 Page 的大小一般为 4K以上三个概念了解后,我们继续看 I/O 操作缓冲I/O读:磁盘->内核缓冲区->用户缓冲区->应用程序写:应用程序->用户缓冲区->内核缓冲区->磁盘对于缓冲I/O,一个读操作会有...
    文章 2022-06-05 24浏览量
  • 弹性计算双周刊 第15期

    弹性计算团队正在通过强化对于硬件服务器的管控能力,对操作系统的定制能力,和对故障隔离能力等等多个维度提升客户对稳定性的体验,宕机率大大降低,在业界遥遥领先。云栖大会弹性计算专场,新一代异构计算“昊天、...
    文章 2018-10-16 2660浏览量
  • 解决微服务架构下流量有损问题的实践和探索

    因此把新应⽤发布到线上直接处理⼤流量极易出现⼤量请求响应慢,资源阻塞,应⽤实例宕机的现象。业界针对上述应⽤⽆损上线场景提出如下包括延迟注册、⼩流量服务预热以及就绪检查等⼀系列解决⽅案,详细完整的⽅案如...
    文章 2022-05-16 678浏览量
1 2 3 4 ... 10 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化