• HBase原理-RegionServer宕机数据恢复

    HBase的故障恢复我们都以RegionServer宕机恢复为例,引起RegionServer宕机的原因各种各样,有因为Full GC导致、网络异常导致、官方Bug导致(close wait端口未关闭)以及DataNode异常导致等等。这些场景下一旦...
    文章 2017-08-01 2004浏览量
  • 短短数月,两代“矿工”遭遇冰与火的洗礼

    最近这时间,相信因为数字货币价格集体跳水而感到恐慌的,不止是炒币的投机客,还有大量“矿工”。在过去一年多时间里,区块链逐渐变为人人热议的亲民话题,“挖矿”也成为很多人热议的火爆职业。甚至有金融界、...
    文章 2018-04-16 1122浏览量
  • heartbeat基础知识

    指定的时间内未收到对方发送的心跳报文,那么,一方就会认为对方失效或者是已经宕机了,这时每个运行正常的主机就会启动自身的资源接管模块来接管运行在对方 主机上的资源或者是服务,继续为用户提供服务。一般情况...
    文章 2017-11-27 948浏览量
  • 应用运维——《应用智能运维实践(试读版)》

    系统故障和宕机频率快速升高&xff0c;人工运维成本飙升。著名管理咨询公司麦肯锡在名为Measuring the Net’s Growth Dividend的分析报告中指出&xff0c;2013—2025年&xff0c;互联网将帮助中国的GDP增长率提升0.3&xff5e;1....
    文章 2021-07-06 340浏览量
  • 云栖科技评论第70期:数字时代需要双螺旋

    GE在工业互联网领域投入数十亿美元,如今却要出售数字业务(GE Digital),虽然失败的原因非常复杂,但是GE建立大规模云基础设施、放弃与数字科技巨头合作,导致其深陷产品能力和大规模运营的泥潭,这已经成为工业...
    文章 2018-08-13 2453浏览量
  • 是该重新思考一下网站综合监测技术的时候啦

    综合测试工具在发现宕机或性能下降时会发出警报。借助这些功能,IT可以主动识别可能影响用户数字体验的可用性问题或主要执行问题。使用综合监测系统的九大理由 以下是IT依赖综合监测系统的一些主要原因。1.监测应用...
    文章 2017-09-01 948浏览量
  • Uber是如何使用MySQL设计可扩展性数据存储的?

    如果凌晨3点我们接到叫车请求,但是这时数据存储无法响应查询,导致业务宕机,我们是否有相关操作知识可以快速解决这个问题。鉴于以上种种,我们分析了几种常用的选择的优势和潜在的限制,比如Cassandra、Riak、...
    文章 2017-05-02 1861浏览量
  • Linux下配置Apache最大连接数

    如果你的VPS遭遇到流量的大幅增加,而你的MaxClients设置的太高的话,你的服务器将会无限循环工作于从物理内存交换页面到虚拟内存中,最终导致宕机。一般计算适当的MaxClients值取决于你总共可用的系统内存除于每个...
    文章 2017-11-09 998浏览量
  • 是该重新思考一下网站综合监测技术的时候啦

    综合测试工具在发现宕机或性能下降时会发出警报。借助这些功能,IT可以主动识别可能影响用户数字体验的可用性问题或主要执行问题。使用综合监测系统的九大理由 以下是IT依赖综合监测系统的一些主要原因。1.监测应用...
    文章 2018-03-07 1014浏览量
  • 日访问量百亿级的应用如何做缓存架构设计

    如果后面这个节点3又恢复了,它又加进来,加进来之后,节点3的访问又会回来,如果节点3因为网络原因或者机器本身的原因,它又宕机了,一些节点3的请求又会分给其他节点,这个时候就会出现问题,之前分散给其他节点写...
    文章 2018-05-07 2920浏览量
  • 知乎技术分享:从单机到2000万QPS并发的Redis高性能...

    5)Sentinel 切换功能主要依赖 down-after-milliseconds 和 failover-timeout 两个参数,down-after-milliseconds 决定了 Sentinel 判断 Redis 节点宕机的超时,知乎使用 30000 作为阈值。而 failover-timeout 则...
    文章 2018-09-18 2992浏览量
  • 区块链信用机制与应用场景介绍

    现实世界中大量的场景都具有这种模式的发挥空间,这是区块链目前被人们寄予厚望的原因所在。区块链是由多个独立节点参与的分布式数据库系统,也称分布式账簿(Distributed Ledger Technology,DLT),所有参与的节点...
    文章 2018-07-30 1811浏览量
  • 数据的增长为能源带来新的挑战

    总而言之,没有足够的电能供应,意味着更加普遍的数据中心宕机事件发生。整体情况也并不乐观。美国土木工程师协会在最新的评估中将美国电网评为D+(这意味着基础设施“大多低于标准”,存在很大风险),同时指出升级...
    文章 2017-07-05 912浏览量
  • 一文看懂 kafka 机制

    或选择第一个“活”过来的Replica(不一定是ISR中的)作为Leader),这个broker宕机的事情,kafka controller也会通知zookeeper,zookeeper就会通知其他的kafka broker。如果这个kafka broker controller宕机了,在...
    文章 2018-07-09 7675浏览量
  • 【区块链丨主题周】区块链信用机制与应用场景介绍

    现实世界中大量的场景都具有这种模式的发挥空间,这是区块链目前被人们寄予厚望的原因所在。区块链是由多个独立节点参与的分布式数据库系统,也称分布式账簿(Distributed Ledger Technology,DLT),所有参与的节点...
    文章 2018-04-04 2638浏览量
  • 阿里巴巴DevOps实践指南(二十)|业务系统安全工程

    5 月 13 日,特斯拉服务系统宕机,市值一夜间蒸发 2800 亿。6 月 3 日苹果 iCloud 云存储服务器故障,用户无法登录。8 月 27 日,思科员工删除虚拟机,导致思科损失 1600 万。12 月 25 日,谷歌服务全球性宕机。频发...
    文章 2021-07-06 212浏览量
  • Zerto与Ovum报告显示:亚太区超过三分之一的企业曾...

    组织机构需要将容灾计划上升至一个IT弹性战略的高度,其目的不仅仅是避免宕机现象的发生,同时也要减少品牌受损和潜在客户流失的风险。所谓IT弹性,就是从客户或者终端用户的角度出发,杜绝服务受到干扰和影响。面对...
    文章 2018-05-09 1003浏览量
  • 系列文章:云原生Kubernetes日志落地方案

    环境的动态性变强,在Kubernetes中,机器的宕机、下线、上线、Pod销毁、扩容/缩容等都是常态,这种情况下日志的存在是瞬时的(例如如果Pod销毁后该Pod日志就不可见了),所以日志数据必须实时采集到服务端。...
    文章 2019-09-08 10938浏览量
  • 揭穿数据中心基础设施管理(DCIM)的神秘面纱

    任何有关DCIM投资的成本效益分析都应该考虑到节约资源、减少宕机时间和提高散热效率,这些因素最终将会对投资回报率产生积极的影响。换言之,汲取自本文开头所提到的旧时代机油滤清器的经验在今天的数字时代依然适用...
    文章 2017-07-03 984浏览量
  • 蚂蚁智能监控

    容灾架构 前文简要提及了架构去单点问题的解决思路,这足以覆盖日常可能发生的节点宕机、网络抖动等小规模故障场景,但是当真正的毁灭性灾难来临时,还需要更高层面的容灾方案来应对。目前基于不同租户保障等级的...
    文章 2021-09-07 40浏览量
  • 天网智能化,打造最安全的智慧城市

    系统可启用集群工作模式进行高可用保护,保证单台节点设备宕机的情况下,迅速由其它节点设备接管它的工作。在宕机设备恢复正常后,可以自动加入集群并与其他节点进行负载分担,提高系统自保护能力,保证智能分析的...
    文章 2017-07-04 966浏览量
  • ICDE:POLARDB定义云原生数据库

    那么请求会重试并且会被发送到一个健康的节点,事实上,当一个节点宕机的时候我们也采用同样的处理方式,所以基本上,P和A问题在某些情况下可以看做是一类问题。我们如何把失败的节点自动剔除并且能够同时保障数据...
    文章 2018-04-20 4586浏览量
  • 6 个 K8s 日志系统建设中的典型问题,你遇到过几个?

    环境的动态性变强,在 Kubernetes 中,机器的宕机、下线、上线、Pod销毁、扩容/缩容等都是常态,这种情况下日志的存在是瞬时的(例如如果 Pod 销毁后该 Pod 日志就不可见了),所以日志数据必须实时采集到服务端。...
    文章 2019-09-18 4574浏览量
  • 数百万台车联网设备同时在线0故障,中瑞集团的云原生...

    但在这种情况下,RocketMQ集群处于一种比较脆弱的状态,需要使用者想办法进行系统性的补救,以确保在下一次出现节点宕机的时候,RocketMQ集群依然能够稳定得运行。比如当一个Master Broker节点出现故障后,虽然Slave...
    文章 2020-10-28 5276浏览量
  • 282天,汇付天下“冲上云霄”

    在周晔“平稳迁移、零宕机、可上可下”的总体要求之下&xff0c;“冲上云霄”项目正式诞生。那么&xff0c;汇付天下为什么要坚定不移地选择“云原生”架构呢&xff1f;云原生并非是一个新的技术领域&xff0c;是Cloud&43;Native...
    文章 2021-03-19 5763浏览量
  • Go程序设计语言3.5 字符串

    试图访问许可范围以外的字节会触发宕机异常: 字符串的第i个字节不一定就是第i个字符,因为非ASCII字符的UTF-8码点需要两个字节或多个字节。稍后将讨论如何使用字符。子串生成操作s[i:j]产生一个新字符串,内容取自...
    文章 2017-05-02 2129浏览量
  • 数据信息驱动工业革命 提高数据清洗效率成为核心之重

    对于未来的智能工业来说,想要达到零宕机、零排放、零维修等目的,必须突破的一个关键点就是关注相关的隐形因素,做好量化与数据交叉关联分析。工业4.0到底会带来什么 智能分析和网络物理系统的出现,为我们实现生产...
    文章 2017-07-04 1208浏览量
  • 快手基于 Apache Flink 的优化实践

    现在我们可以认为 1、2、3、4、5、6 这 6 个数字的加和结果并没有丢失。这个时候&xff0c;offset 从 7 开始消费&xff0c;跟作业失败前完全对接了起来&xff0c;确保了 exactly-once。3、事件时间时间类型分为两种&xff1a;...
    文章 2020-11-19 6473浏览量
  • 大促场景系统稳定性保障实践经验总结

    江煵在分享中提到,今年我们在新闻里听到了很多比较大的宕机事件,宕机的原因其实都很典型,删库跑路、被攻击、没有做好容量规划或者弹性能力不足、系统更改等。宕机后果还是比较严重,比如某SaaS服务商直接经济损失...
    文章 2020-11-12 6669浏览量
  • Oracle内核技术揭密.2.1 调优排故的一般步骤

    但如果遇到故障,特别是异常宕机的故障,则很难知道最后时刻Oracle登记的事件是什么。如果能找到这个事件,对于诊断宕库类故障将很有意义,因为根据事件可以推测出Oracle最后时刻的动作。下面说一下如何挖掘宕库时...
    文章 2017-05-02 1467浏览量
1 2 3 4 6 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化