• MySQL-高可用性:少宕机即高可用?

    导致宕机的原因通常是方面的的,我们很难去回顾问题当时所处的状况,也很难找到真正的原因。因此,我们在事后反思得到的结论应该有所保留。4 总结可用性用宕机时间 n 个 9 来衡量。实现可用性从平均失效时间和平均...
    文章 2019-04-29 1105浏览量
  • 666IDC高防服务器 全年24小时30秒售后回复 有问题找我

    3)告知宕机的详细原因,如硬件故障,内核bug,网络异常等等。4)自动报修生成工单。我们知道,进行全网物理机宕机准确探测与实时发现,可以给宕机分析提供第一现场,获取第一现场的日志。也可以尽早将宕机数据推送给...
    文章 2020-05-14 499浏览量
  • 热备方案及双热备软件选择

    保证两台磁盘阵列柜数据完全一致,在服务器读取数据时,会从两台磁盘阵列柜同时读取,提高读取效率,一旦主服务器发生故障(例如:操作系统宕机、服务器意外掉电、网络故障等),由ServHA双机热备软件自动将业务应用...
    文章 2017-08-09 4160浏览量
  • 将关键性业务应用迁移至云环境前,必须弄清的五个问题

    这种访问不同路径的能力还能够切实解决系统宕机或者载入速度过慢等问题——无论其源自流量路由问题还是恶意攻击。除此之外,选择家云服务供应商还能帮助大家尽快对流量进行重新路由,从而确保将中断状况控制在最低...
    文章 2017-07-06 939浏览量
  • 阿里如何做到百万量级硬件故障自愈?

    对于宕机的机器而言,无法进无盘(ramos)才开【无故宕机】维修工单,这样能够大量地减少误报,减少服务台同学负担。无盘中的压可以完全消除当前版本的kernel或软件的影响,真实地判断出硬件是否存在性能问题。b....
    文章 2018-11-24 3453浏览量
  • 阿里如何做到百万量级硬件故障自愈?

    对于宕机的机器而言,无法进无盘(ramos)才开【无故宕机】维修工单,这样能够大量地减少误报,减少服务台同学负担。无盘中的压可以完全消除当前版本的kernel或软件的影响,真实地判断出硬件是否存在性能问题。b....
    文章 2018-11-19 2988浏览量
  • 数据中心NFV技术可靠性研究

    不过,运营商需要的是高可靠性的网络,对网络可靠性要求最高,但看看我们应用了虚拟化技术的表现,2015年十大云计算宕机的收入损失超过了31 Million美元,显然这样的技术无法满足运营商的可靠性要求。运营商当然不...
    文章 2017-08-01 1318浏览量
  • 高可用系统常用解决手段浅述

    出现系统不可用的原因,一种是人为的,比如发布了有 bug 的代码、不规范的发布流程导致的宕机或者网站访问量过载造成的雪崩等;另一种则是非人为的,由于外部系统和环境的变化造成的,比如硬盘老化造成的故障、机房...
    文章 2017-05-23 1493浏览量
  • RAKsmart美国服务器经常遇到的一些状况

    造成RAKsmart美国服务器系统重启的原因也有很,主要有以下几种情况,大家可以逐一排查。①、由于电源故障而导致的。②、内存故障也可以引起系统重启,具体可以从BIOS错误报告中来查看。③、占用的数据流量过大, 3...
    文章 2020-04-17 824浏览量
  • OceanBase高可用实践

    分布式系统往往采取比较廉价的硬件,其可靠性相对于小型机、专有硬件有很大的不足,而分布式系统的规模一般比较大,假如硬件的可靠性只有三个9(99.9%),一个1000台机器规模的集群每天将面临1台机器宕机的风险,...
    文章 2019-07-28 1621浏览量
  • 应对数据中心灵活性的挑战

    像Instagram,Netflix和Pinterest这样以云业务为核心的公司,业务宕机长达6个小时。为更清晰地描述云计算的灵活性,国际工作组为此做一次调研。这份调研报告显示,自2007年以来,已经有13个重要运行商被记录有568...
    文章 2017-07-05 1106浏览量
  • SQL Server中的高可用性(1)-高可用性概览

    再比如说,一个依赖于SQL Server的呼叫中心,如果数据库宕机,则所有的呼叫员都只能坐在那里回复客户“对不起,系统故障”,这也是很难接受的。当然,在一个理想的世界中,所有的关键数据都会时刻在线,但在现实世界...
    文章 2017-12-07 1570浏览量
  • 双11幕后超级英雄:新一代运维的价值

    “双十一”刚刚结束,其实最紧张的不是商铺理货,也不是网友紧盯大促商品准备秒杀,而是网购幕后的运维人员,他们最担心:什么网络中断、应用卡顿、响应速度慢,服务器宕机…… 双十一作为电商 IT 部门的头等大事,...
    文章 2017-11-15 4738浏览量
  • 阿里巴巴DevOps实践指南(二十)|业务系统安全工程

    5 月 13 日,特斯拉服务系统宕机,市值一夜间蒸发 2800 亿。6 月 3 日苹果 iCloud 云存储服务器故障,用户无法登录。8 月 27 日,思科员工删除虚拟机,导致思科损失 1600 万。12 月 25 日,谷歌服务全球性宕机。频发...
    文章 2021-07-06 227浏览量
  • [New Portal]Windows Azure Virtual Machine(1)概念

    在单台Guest OS的情况下,当Guest OS宕机的时候,重新部署与启动Guest OS会需要花费一定的时间,会引起客户应用的短暂离线,所以Microsoft Azure没有单个实例的SLA。微软有没有单个实例的SLA?微软没有单个实例的SLA...
    文章 2017-04-30 1103浏览量
  • 天梭M13为何具有大型水平的高可用性

    稳定性源于层级的RAS设计,即可靠性、可用性和服务性,旨在确保让系统不出故障,即使一旦出现故障,要使之不影响、或者少影响系统运行,这不仅是一个复杂的技术问题,而是一个复杂的系统工程问题。一方面,需要...
    文章 2017-08-02 1456浏览量
  • 关于Redis的几件小事|高并发和高可用

    slaves-max-lag这个配置,就可以确保说,一旦slave复制数据和ack延时太长,就认为可能master宕机后损失的数据太了,那么就拒绝写请求,这样可以把master宕机时由于部分数据未同步到slave导致的数据丢失降低的控...
    文章 2019-07-23 978浏览量
  • 分布式存储系统基础

    引发服务器宕机的原因有很,例如内存错误、服务器停电等等。服务器宕机可能随时发生,当发生宕机时,节点无法正常工作。服务器重启后,节点将失去所有的内存信息。因此,设计存储系统时需要考虑如何通过读取持久化...
    文章 2017-08-09 1649浏览量
  • 大促场景系统稳定性保障实践经验总结

    江煵在分享中提到,今年我们在新闻里听到了很比较大的宕机事件,宕机的原因其实都很典型,删库跑路、被攻击、没有做好容量规划或者弹性能力不足、系统更改等。宕机后果还是比较严重,比如某SaaS服务商直接经济损失...
    文章 2020-11-12 7184浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    也可能Kernel出现类似208天的问题(Linux Kernel著名的一个Bug:系统连续运行208.5天自行重启),引起机器大批量的宕机。基于以上考虑,结合华佗自我保护机制,华佗引入Quota管理和手工驾驶,即当故障率超过华佗预设...
    文章 2016-12-18 4739浏览量
  • 根本原因分析 关键事件关联 IT运维有序发展——中国...

    对于性能指标超标、宕机故障,通过手机短信、邮件直接发送给系统的管理员、维护人员及其他相关人员,在报警信息中明确哪台主机、哪个wps应用服务器、哪个应用、故障发生的时间、初步定位的故障原因等重要信息,方便...
    文章 2017-11-09 1547浏览量
  • 甩掉运维黑锅,容灾部署如何破?

    1.由于某些不抗拒的原因,华北电信的数据中心两个接入IP地址:3.3.3.3、4.4.4.4全部出现故障,并无法及时恢复;2.网站监控及时发现故障,并通知云解析DNS暂停所有华北电信线路下IP解析;3.云解析DNS暂停解析后,会...
    文章 2017-04-19 11913浏览量
  • 阿里基础设施的智能监控

    二、网络监控系统阿里的网络设备复杂多样,数量极故障难以避免,故障会影响网络所承载的业务系统,所以网络故障快速、准确地发现、定位、以及收敛成为了网络监控系统的最基本需求。此外端口集,交易机房,支付...
    文章 2019-07-30 1322浏览量
  • 10款常见MySQL高可用方案选型解读

    并且节点同时宕机的几率也要小于单节点宕机的几率,所以节点架构在一定程度上可以认为高可用性是好于双节点架构。但由于数据库数量较,所以需要数据库管理软件来保证数据库的维护性。可以选择MMM、MHA或者...
    文章 2017-05-16 5878浏览量
  • MySQL数据库的几种常见高可用方案

    并且节点同时宕机的几率也要小于单节点宕机的几率,所以节点架构在一定程度上可以认为高可用性是好于双节点架构。但是由于数据库数量较,所以需要数据库管理软件来保证数据库的维护性。可以选择MMM、MHA或者...
    文章 2017-04-25 12802浏览量
  • 分库分表中间件的高可用实践

    而重启的时间也会导致不可用,与物理机宕机的情况相比是其不可用的时间点是可知的,重启的动作也是控的,那么我们就可以利用这些信息去做到流量的平滑无损。让client端感知即将下线 在笔者所知的很做法中,让...
    文章 2019-05-15 1782浏览量
  • 《架构师》反思:系统可靠性

    但是可能会导致“单点错”,即系统中某一部件或某个应用程序发生故障时,导致所有系统全部宕机。如磁盘阵列如果出错,可能会导致存储的数据全部丢失。特点:性能较高、可能导致单点错误。(3)光纤通道双机双控集群...
    文章 2016-05-05 4907浏览量
  • 《叶问》第8期

    知数堂」祝大家节日快乐,DB不宕机跑得欢。2018年10月9日,周二 MySQL线上实例insert慢常见原因有哪些?1、锁等待:SQL产生的间隙锁、自增锁、死锁、MDL锁、外键检查锁,锁等待时间2、iops达到瓶颈:例如备份任务、...
    文章 2018-11-29 1140浏览量
  • 《架构师》反思:系统可靠性

    但是可能会导致“单点错”,即系统中某一部件或某个应用程序发生故障时,导致所有系统全部宕机。如磁盘阵列如果出错,可能会导致存储的数据全部丢失。特点:性能较高、可能导致单点错误。(3)光纤通道双机双控集群...
    文章 2017-11-08 1017浏览量
  • 揭秘|连续3年支撑双11,阿里云神龙如何扛住全球流量...

    四 单实例可用性99.975%的底气,平稳应对“宕机”突袭大考全链路压演练是备战双11必不少的环节,我们为突袭演练专门设计了App,简化成一个“按钮”,串联了阿里巴巴经济体的各种技术架构和业务手段。今年的演练...
    文章 2020-12-11 673浏览量
1 2 3 4 ... 15 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化