• 五分钟学后端技术:分布式系统理论-从放弃到入门

    宕机的participant恢复后发现收到precommit或已经发出赞成vote,则自行commit该次事务 阶段3:即便coordinator或watchdog未收到宕机participant的commit ACK,也结束该次事务;宕机的participant恢复后发现收到commit...
    文章 2020-03-23 1014浏览量
  • 15年不忘初心 刀片服务器核心价值梳理

    原因有很多,但很重要的两点:一是刀片服务器本身的设计(模块化设计、几乎组件冗余),二是管理的简化降低了人为出错 的风险,要知道如今系统宕机有很多是人为因素引起的。与此同时,使用刀片服务器后在性能上...
    文章 2017-09-01 1241浏览量
  • 15年不忘初心 刀片服务器核心价值梳理

    原因有很多,但很重要的两点:一是刀片服务器本身的设计(模块化设计、几乎组件冗余),二是管理的简化降低了人为出错 的风险,要知道如今系统宕机有很多是人为因素引起的。与此同时,使用刀片服务器后在性能上...
    文章 2017-07-03 1337浏览量
  • 云数据中心呼唤安全可控的运维

    2014年4月21日,三星数据中心火灾引发服务器大规模宕机;2015年2月11日国内十大酒店数据因安全漏洞而泄露大量用户隐私……这些频频发生的数据中心安全事件,一直在提醒我们:安全是IDC运维的第一要务。因此,需要在...
    文章 2017-08-02 1222浏览量
  • 云数据中心呼唤安全可控的运维

    2014年4月21日,三星数据中心火灾引发服务器大规模宕机;2015年2月11日国内十大酒店数据因安全漏洞而泄露大量用户隐私……这些频频发生的数据中心安全事件,一直在提醒我们:安全是IDC运维的第一要务。因此,需要在...
    文章 2017-08-02 1584浏览量
  • 云数据中心呼唤安全可控的运维和检测

    2014年4月21日,三星数据中心火灾引发服务器大规模宕机;2015年2月11日国内十大酒店数据因安全漏洞而泄露大量用户隐私……这些频频发生的数据中心安全事件,一直在提醒我们:安全是IDC运维的第一要务。因此,需要在...
    文章 2017-07-03 1479浏览量
  • 云数据中心呼唤安全可控的数据中心运维

    2014年4月21日,三星数据中心火灾引发服务器大规模宕机;2015年2月11日国内十大酒店数据因安全漏洞而泄露大量用户隐私……这些频频发生的数据中心安全事件,一直在提醒我们:安全是IDC运维的第一要务。因此,需要在...
    文章 2017-07-10 1438浏览量
  • 知乎技术分享:从单机到2000万QPS并发的Redis高性能...

    5)Sentinel 切换功能主要依赖 down-after-milliseconds 和 failover-timeout 两个参数,down-after-milliseconds 决定了 Sentinel 判断 Redis 节点宕机的超时,知乎使用 30000 作为阈值。而 failover-timeout 则...
    文章 2018-09-18 3018浏览量
  • 短短数月,两代“矿工”遭遇冰与火的洗礼

    且不说算力高低,是频繁的宕机、故障,就曾让他吃尽了苦头。“要无时无刻盯着,晚上睡觉都得守着,哪一台出了问题马上就排除问题,好长时间都没睡好。相比GPU弱鸡的早期矿机,这几台配装了RX 470矿卡的“二手货”...
    文章 2018-04-16 1139浏览量
  • 日访问量百亿级的应用如何做缓存架构设计

    如果后面这个节点3又恢复了,它又加进来,加进来之后,节点3的访问又会回来,如果节点3因为网络原因或者机器本身的原因,它又宕机了,一些节点3的请求又会分给其他节点,这个时候就会出现问题,之前分散给其他节点写...
    文章 2018-05-07 2950浏览量
  • 带你读《KVM实战:原理、进阶与性能调优》之一:虚拟化...

    2.虚拟化与半虚拟化相反的,虚拟化(Full Virtualization)坚持第一个理想化目标:客户机的操作系统完全不需要改动。敏感指令在操作系统和硬件之间被VMM捕捉处理,客户操作系统无须修改,所有软件都能在虚拟机中...
    文章 2019-10-31 3634浏览量
  • 国产化新出路:中国服务器市场变形记

    RAS 2.0技术使产品在安全性上变被动为主动,可靠性达到99.9996%(年计划外理论宕机时间少于2分钟)。华为kunlun RAS2.0技术 不同于以往的小型机的RISC架构,华为KunLun采用了X86处理器,打破了传统小型机其上层软件...
    文章 2017-07-05 2640浏览量
  • 面对大规模 K8s 集群,如何先于用户发现问题?

    比如,监控告警一般的告警可能如下:xx容器内存使用率 99%webhook 双副本全部挂掉了apiserver 三副本全部宕机了这些告警,往往内容中就包含了具体的故障点,而 KubeProbe 的链路探测告警就有很多不一样,比如:...
    文章 2021-04-25 2177浏览量
  • MongoDB World 2016参会记录

    本次大会有好几个分享MongoDB内部测试相关的主题,我听了3个分享,分别讲MongoDB的持续集成测试、宕机测试、性能测试,感觉MongoDB在测试上的确做得很好,非常值得学习,总的来说就是将所有的测试『自动化』。...
    文章 2016-07-05 9526浏览量
  • 分布式系统架构,回顾2020年常见面试知识点梳理(每次...

    如果缓存数据设置的过期时间是相同的,并且 Redis 恰好将这部分数据全部删了。这就会导致在这段时间内,这些缓存同时失效,全部请求到数据库中。这就是缓存雪崩。问:怎么解决缓存雪崩?解决方法:在缓存的时候给...
    文章 2020-12-30 238浏览量
  • 存储极客|浅析固态介质在存储系统中的应用方式

    【方式4】非易失性写缓存/NVRAM大家都知道分布式系统一般是利用节点间镜像来防止一个节点宕机之后缓存数据的丢失。而如果是所有节点全部掉电呢?比如某长时间停电,或者雷击等导致包括UPS在内的全部电力供应中断,...
    文章 2017-08-09 1498浏览量
  • 国内外公有云对比:功能介绍、性能测试

    虚拟机的管理界面比较简单,具有基本的虚拟机、磁盘、快照、镜像管理功能。虚拟机支持启动停止、修改密码。网络部分的功能十分欠缺 阿里云的磁盘支持快照,可以从快照回滚。不过不能从快照创建新的磁盘。另外,一个...
    文章 2020-05-11 2590浏览量
  • 高可用之2——存储b

    曾经碰到过这样的问题,比如有人问,我们有一个磁盘阵列,连到了两个主机上,我们划分了一个lun给两个主机,然后我们想,先在操作系统将磁盘分为两个区,让两个主机分别使用两个分区,然后再出现某一台主机宕机之后...
    文章 2012-06-02 1349浏览量
  • 历年双11实战经历者:我们是如何做数据库性能优化及运...

    面对这样的问题,很多时候是DB节点发生了主备切换,OOM或者crash,这样的情形是比较好排查的,但是对于DB上层的链路,比如proxy出现了抖动,上层SLB做了网络变更,甚至再上层的网络交换出现了down或者丢包,这个...
    文章 2017-09-07 10012浏览量
  • Java高质量面试总结

    说说最有成就感的一项任务深入考察的技术点:Java框架:Spring源码的AOP和IOCJDK:ConcurrentHashMap如何提高并发度NIO的原理,包括零拷贝,堆外内存以及优缺点虚拟:包冲突,类冲突的形成原理以及解办法,可以引申到JDK 9...
    文章 2021-11-28 21浏览量
  • 工作三年后,我选择离开腾讯

    写前端页面的,可能没人把写好的接口交给你,而是需要自己写服务器脚本、自己调优数据库,还得自己盯着运维数据,宕机了得马上修复。做产品的,不是只打开word来写需求文档,用户调研、交互图得自己做,上线后的运营...
    文章 2017-11-08 1519浏览量
  • DTCC 2019|NoSQL数据库最新发展趋势 如何拥有居家必备...

    而阿里云提供了一整套完整的容灾体系,对于同城、异地容灾体系而言,阿里云提供了同城多机房部署、宕机重建技术以及Mongoshake异地双向复制能力,能够杜绝机器级、机房级、地方级故障影响,并且能够满足监管、合规、...
    文章 2019-05-24 3035浏览量
  • 救火必备!问题排查与系统优化手册

    宿主机宕机、网络不通、丢包。操作失误:e.g.配置推错、删库跑路(危险动作,请勿尝试.)。上述分类可能不太完备和严谨,想传达的点是:你也可以积累一个这样的 checklist,当遇到问题百思不得其解时,耐心过一遍,...
    文章 2020-07-13 2196浏览量
  • 深入探访支付宝双11十年路,技术凿穿焦虑与想象极限|...

    2012年双11之前,支付宝技术组已经把能想象到的压力测试做了个遍,但当晚高峰期还是出了岔子,运维工程师巩杰(花名袁越)记得,当时后台一条数据通道设置的阈值太低,导致短暂宕机,但系统认定为无法响应,于是自动...
    文章 2018-12-24 2716浏览量
  • 在「不可靠」硬件上,分布式数据库如何保证数据可靠性...

    采用Write-Ahead-Log(WAL)模式的Redo Log可以保证数据库中已提交的数据不会丢失,如果已提交的数据还在内存中就发生了宕机等意外,利用Redo Log可以恢复这些还未持久化的数据。但这里有一个前提,就是Redo Log自身...
    文章 2019-08-06 902浏览量
  • 含PPT下载|李飞飞:如何看待数据库的未来?

    此外,还有读和写的冲突问题,比如在数据库里做批量写入的时候系统宕机,应该考虑如何让系统自动恢复。为解决以上的问题,数据库系统提出了一个核心概念——事务。简单而言,事务就是一系列动作可以被看作一个整体,...
    文章 2020-02-25 8297浏览量
  • 为什么已经有了自建服务器,还需要去IDC机房托管,...

    还有,遇到宕机的时候,我们还需要为每个硬件准备冗余,部署与维护成本成本就上去了。​ 同时,增减硬件也是挺麻烦的,带宽也是。有时候需要临时搞活动,硬件需要购置时间。带宽也不能提升,因为我这边的ISP服务商...
    文章 2020-05-11 733浏览量
  • 秋招结束面试和面经的总结(个人向)

    } else {/必须异步执行,否则恢复后动画速度可能会加快,从而导致弹幕消失或重叠,原因不明 this._resumeTimer=setTimeout(()=gt;{ this.resume();},200);}},false);先看下暂停滚动的主要代码(注意已滚动路程 ...
    文章 2021-10-10 34浏览量
  • 亲密接触Redis-第一天

    还是redis不够新不够稳定的原因,由于在redis3前redis还不支持集群、主备高可用方案的功能,因此不得不依靠于繁杂的打补丁式的如:linux/unix-keepalive或者是haproxy这种系统级层面然后写一堆的复杂脚本去维护你的...
    文章 2016-02-03 1143浏览量
  • 带你读《HikariCP数据库连接池实战》之二:数据库连接...

    这样就会极大地浪费数据库的资源,极易造成数据库服务器内存溢出、宕机。3)为了执行一条SQL,却产生了很多我们并不关心的网络IO。4)应用如果频繁地创建连接和关闭连接,会导致JVM临时对象较多,GC频繁。5)频繁...
    文章 2019-11-08 3020浏览量
1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化