• 石家庄运用大数据平台管控电梯安全

    “电梯应急处置平台”运行后,发生故障的电梯属于哪个维保单位,维保单位签约维保的电梯每月发生故障的数量、频次,救援时效等情况一目了然。质监部门以维保单位的维保质量和救援效率作为主要内容对在电梯维保单位...
    文章 2017-07-05 1580浏览量
  • 学习分布式不得不会的ACP理论

    网络发生故障宁可停止服务,这是保证CA,舍弃P。比如前几年支付宝光缆被挖断的事件,在网络出现故障的时候,支付宝就在可用和数据一致之间选择了数据一致,用户感受到的是支付宝系统长时间宕机,但是其实背后...
    文章 2018-07-21 2301浏览量
  • 链路分析 K.O“五大经典问题”

    1.【流量不均】负载均衡配置错误,导致大量请求打到少量机器,造成“热点”影响服务可用怎么办?流量不均导致的“热点击穿”问题,很容易造成服务不可用,在生产环境中出现过多起这样的案例。比如负载均衡配置...
    文章 2021-11-27 10浏览量
  • 疫情期,APP 崩了怎么办?阿里工程师公开高可用架构...

    脱胎于阿里巴巴电商业务下的高可用技术体系经过所有的双11流量洪峰考验、日常稳定考验,已经服务于阿里全生态并开始服务外部的企业客户,解决方案为企业提供的包括营销活动支撑、整体成本控制(全链路压测、容量...
    文章 2020-02-18 4598浏览量
  • 机房搬迁的一般步骤方案

    制定应急预案对于搬迁过程中可能发生的多种突发事件的应急方案,如主机不能正常运转怎么办?责任到人,设备拆卸、除尘、搬运都要有专人负责。确保搬迁阶段前新机房市电供应正常、UPS工作正常、精密空调工作正常,...
    文章 2017-07-03 1356浏览量
  • 疫情期,APP 崩了怎么办?阿里工程师公开高可用架构...

    脱胎于阿里巴巴电商业务下的高可用技术体系经过所有的双11流量洪峰考验、日常稳定考验,已经服务于阿里全生态并开始服务外部的企业客户,解决方案为企业提供的包括营销活动支撑、整体成本控制(全链路压测、容量...
    文章 2020-02-18 5080浏览量
  • 没有IT流程文档 企业将为IT所“绑架”

    如今,似乎没有一天不发生网络入侵事件,导致金钱和数据被窃取,甚至给企业或政府带来巨大损害。这些事故反映了防范措施方面的漫不经心,以及企业高管们对股东利益的漠视。2014年,瑞士苏黎世保险集团(Zurich ...
    文章 2017-07-03 1037浏览量
  • 彻底厘清真实世界中的分布式系统

    Gilbert 和 Lynch 合写的「对 CAP 定理的看法」明确了易出故障(fault-prone)系统固有的安全(safety)与活性(liveness)之间的权衡,而 Fox 和 Brewer 合写的「完备度、完成概率和可扩展的容忍系统」从更实用...
    文章 2017-09-22 1510浏览量
  • 如何维护云中的安全合规

    外部控制系统上维护安全和遵从标准可能会让人望而生畏。或者更糟的是,管理者可能会认为,由于服务和数据不在他们的数据中心运行,这让他们有些无所适从。行业机构最近发布了关于云计算安全合规中的关键挑战...
    文章 2017-10-02 855浏览量
  • SQL server与Oracle数据库镜像对比

    运行在这种模式下,允许有少量的数据丢失,因为在发生故障(无论什么样的故障)前,恢复能够在任意一个点上执行。在SQL Server中是类似的,但是有三种状态需要选择。《SQL Server联机丛书》,像许多其它的在线资源...
    文章 2017-07-10 1218浏览量
  • 阿里、万国、XDC+数据中心建设经验分享

    UPS,在数据中心电力运维方面,整个数据中心采用统一的UPS,以保障任何一台UPS出现故障,都会有备件的UPS来支撑数据中心业务连续,并为每组数据中心机房模块配备独立的2NUPS,以保障电力设施的可靠;在整个系统...
    文章 2017-08-01 1759浏览量
  • 秘诀!支付宝支撑双十一4200万次/秒的数据库请求峰值...

    在节点角色上,有几个节点(root service)负责管理集群拓扑结构等全局信息,相对特殊一点,但每个节点都具备承担这个角色的能力,如果当前承担该角色的节点发生故障,集群会自动选举出新的节点承担这个角色。...
    文章 2018-05-10 2683浏览量
  • 年轻人不讲武德,偷袭阿里的机房

    总会有各种原因和各种理由让一台服务器发生故障的,可能是过载了,可能是老鼠咬线了,可能是冷凝液泄露了,甚至可能是被知乎用户派人炸了。知乎上有人问过一个问题,如果阿里云数据中心崩了或者被人炸了,是不是淘宝...
    文章 2020-11-18 6028浏览量
  • 2017QCon分享:从淘宝到云端的高可用架构演进

    这个给我们带来的启示是什么,云服务本身也是会发生故障的,比如买了云数据库,我们没有办法假设它是100%可用的,当它出现问题我们怎么办,是给云厂商提工单说什么时候能恢复,还是我自己能够有一个容灾的方案解决这...
    文章 2017-10-25 2954浏览量
  • 为什么说传统分布式事务不再适用于微服务架构?

    这可能持续一个不确定的时间,尤其是在系统已经表现出高延迟时或者网络故障导致失去连接时。依据目前的成功经验,可用一般是更好的选择,但是在服务和数据库之间维护数据一致是非常根本的需求,微服务架构中应...
    文章 2017-08-01 1314浏览量
  • 为什么说传统分布式事务不再适用于微服务架构

    这可能持续一个不确定的时间,尤其是在系统已经表现出高延迟时或者网络故障导致失去连接时。依据目前的成功经验,可用一般是更好的选择,但是在服务和数据库之间维护数据一致是非常根本的需求,微服务架构中应...
    文章 2017-07-03 1583浏览量
  • 分布式事务一致"看这一篇就够了

    这可能持续一个不确定的时间,尤其是在系统已经表现出高延迟时或者网络故障导致失去连接时。依据目前的成功经验,可用一般是更好的选择,但是在服务和数据库之间维护数据一致是非常根本的需求,微服务架构中应...
    文章 2018-04-17 10638浏览量
  • 2.0解析系列|一文详解新一代OceanBase云平台

    然而,对于大多数企业级客户,有些是租用第三方机房,有些不具备三机房条件,基础网络的可靠也不高,延时不稳定,开源产品运行故障率很高,OCP的SLA无法得到保证。2.业务的变化 众所周知,阿里双十一所面临的高...
    文章 2018-10-10 1857浏览量
  • 纯干货|从淘宝到云端的高可用架构演进

    这个给我们带来的启示是什么,云服务本身也是会发生故障的,比如买了云数据库,我们没有办法假设它是100%可用的,当它出现问题我们怎么办,是给云厂商提工单说什么时候能恢复,还是我自己能够有一个容灾的方案解决这...
    文章 2017-06-19 2162浏览量
  • 微服务架构下的事务一致保证

    这可能持续一个不确定的时间,尤其是在系统已经表现出高延迟时或者网络故障导致失去连接时。依据目前的成功经验,可用一般是更好的选择,但是在服务和数据库之间维护数据一致是非常根本的需求,微服务架构中应...
    文章 2016-12-09 18102浏览量
  • 车联网上云最佳实践(二)

    痛点5:基础设施可靠差,故障频发 传统IDC底层基础设施通常都是企业自己搭建的,这里会有很多原因导致底座基础设施不稳定的因素。例如企业一开始对硬件投入不重视,使用廉价的设备;再例如工程师技术能力有限,...
    文章 2018-08-22 2618浏览量
  • 如何设计稳定横跨全球的 Cron 服务

    为了解决这个问题,所有在外部系统进行的操作,要么其操作是幂等的(也就是说,我们可以放心的执行它们多次),要么我们必须实时监控它们的状态,以便能清楚的知道何时完成。这些条件明显增加了限制,实现起来也有...
    文章 2017-06-05 1104浏览量
  • 企业安全管理的“六脉神剑”

    当考虑确定计算系统、数据和网络的可用和完整控制时,与可考虑潜在机会授权的管理员相比,普通用户拥有更少的特权。系统管理员、执行备份的操作人员、数据库管理员、维修技师甚至帮助台支持人员的运营商,都纷纷...
    文章 2017-05-02 1276浏览量
  • 2017,那些我们一起删库跑路的日子

    很多时候严重的故障,需要较大规模的专业团队协作处理,原厂商和第三方在其中都承载着重要的角色,所以关键时刻,要能够获得内外部快速及时的支持,尤其是在绵延数天的高强度工作中。讲真,不要把我们的话当成耳旁风...
    文章 2017-07-17 3256浏览量
  • DAS 解决延时突高的案例分享

    从数据库到网络,甚至咨询了做监控的同学,以确认延时时间的正确。通过反复调查,我们才将问题定位在客户端。在排查问题的过程中,好的监控起到了关键作用。一般监控有两类输出:警告和日志。应用团队就是通过警告...
    文章 2020-03-27 668浏览量
  • 阳振坤:数据库天然选择了计算机,但计算机天然并不...

    无论是主库备库不一致,还是分布式数据库的缺失,根本的原因是传统关系数据库自身高可用的缺失,即今天的传统关系数据库都是通过外部硬件来保证可用,而没有从数据库系统内部来解决问题。OceanBase的目标:十倍...
    文章 2018-06-29 6256浏览量
  • Kubernetes Operator深入详解

    我们不能将无法连接到 etcd 作为 etcd 没有在运行的信号(如果我们这么认为了,那么重启 etcd 实例只会加重网络中断的发生)。通常,在与非 Kubernetes API 服务通信时,最重要的是要考虑可用或一致。对于 etcd 来...
    文章 2020-12-24 618浏览量
  • 年关将至,服务器被入侵了怎么办

    通过外部端口扫描收集开放端口信息,然后获取到反弹shell信息,登陆机器发现关键命令已经被替换,后面查看history记录,发现疑似木马文件,通过简单逆向和进程查看发现了异常进程,从而锁定了入侵原因。具体内容可以...
    文章 2017-05-15 2059浏览量
  • 2.0 解析系列|一文详解新一代OceanBase云平台

    然而,对于大多数企业级客户,有些是租用第三方机房,有些不具备三机房条件,基础网络的可靠也不高,延时不稳定,开源产品运行故障率很高,OCP的SLA无法得到保证。2.业务的变化 众所周知,阿里双十一所面临的高...
    文章 2018-10-10 2557浏览量
  • 车联网上云最佳实践(一)

    消息队列集群:由于在高并发环境下,系统来不及同步处理,请求往往会发生堵塞,比如说,大量的insert,update之类的请求同时到达MySQL,直接导致无数的行锁表锁,甚至最后请求会堆积过多,从而触发too many ...
    文章 2018-08-31 2947浏览量
1 2 3 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化