• 双11黑科技,阿里百万级服务器自动化运系统...

    上面就是中心,中心做了双机房容灾部署,同时在线提供服务,其中一个机房挂掉对业务是没有影响的。问题&挑战 如上图:是我们前年在做系统重构时遇到的问题: 前三个问题有点类似,主要是任务由状态导致,1.0的...
    文章 2017-12-01 12216浏览量
  • 使用SLS发现服务节点异常

    一台服务器挂掉&xff0c;流量会自动转发到其他健康的服务器&xff1b;但是作为后台开发运人员&xff0c;还需要关注是哪些节点的服务挂掉了。本文介绍一种通过日志分析来发现节点服务不可用并进行告警的方法。问题分析某个...
    文章 2021-08-06 67浏览量
  • ZooKeeper管理员指南——部署与管理ZooKeeper

    另外,这些down掉的机器重启之后,能够自动加入到集群中,并且自动和集群中其它机器进行状态同步(主要就是从Leader那里同步最新的数据),从而达到自我恢复的目的。因此,我们很容易就可以想到,是否可以借助一些...
    文章 2016-04-08 2539浏览量
  • 给 K8s API“做减法”:阿里巴巴云原生应用管理的挑战...

    而 Operator 以及 K8s 的各种工作负载组件(Deployment、StatefulSet 等),具体来说就像某个实例了这些组件自动拉起来一个弥补上原来所需要三个的实例,包括一些自愈、扩缩容等能力,对应在第 3 层;...
    文章 2019-11-23 3154浏览量
  • 应用开发实践之关系型数据库(以MySql为例)小结

    主要是一写多读的架构,在主库挂掉的场景下有可能需要考虑使用paxos算法来决定新的主库。在做读写分离前,可以先考虑缓存是否能解决当前场景的问题。五、运 binlog记录DB操作(不含查询)及其他执行信息的二进制...
    文章 2020-05-05 632浏览量
  • 滴滴出行基于RocketMQ构建企业级消息队列服务的实践

    横坐标是每秒消息,纵坐标是测试case。同时覆盖了有无消费,和不同消息体的场景。一共8测试数据,每数据分别在Topic个数为16、32、64、128、256时获得的,每个topic包括8个Partition。下面四数据是发送消息...
    文章 2018-11-05 5395浏览量
  • 滴滴出行千亿级消息队列炼成记!

    横坐标是每秒消息,纵坐标是测试case。同时覆盖了有无消费,和不同消息体的场景。一共8测试数据,每数据分别在Topic个数为16、32、64、128、256时获得的,每个topic包括8个Partition。下面四数据是发送消息...
    文章 2018-11-12 1171浏览量
  • 滴滴出行基于RocketMQ构建企业级消息队列服务的实践

    横坐标是每秒消息,纵坐标是测试case。同时覆盖了有无消费,和不同消息体的场景。一共8测试数据,每数据分别在Topic个数为16、32、64、128、256时获得的,每个topic包括8个Partition。下面四数据是发送消息...
    文章 2018-11-16 1041浏览量
  • 常见Serialize技术探秘(ObjectXXStream、XML、JSON、...

    其实不然,MySQL传递数据给JDBC默认是走文本协议的,而不是Binary协议,虽然说它的byte[]数组不会像JSON那样放大,并不算真正意义上的文本协议,但是它很多种数据类型默认情况下,都是文本传输,例如一个上面提到的...
    文章 2018-10-29 1230浏览量
  • 基于Serverless的云原生转型实践

    另一个互联网企业需要云原生转型的原因是中国的刘易斯拐点已经到来。刘易斯拐点&xff0c;即劳动力过剩向短缺的转折点&xff0c;是指在工业化进程中&xff0c;随着农村富余劳动力向非农产业的逐步转移&xff0c;农村富余劳动力...
    文章 2021-03-08 3132浏览量
  • 给 K8s API“做减法”:阿里巴巴云原生应用管理的挑战...

    具体来说就像某个实例了这些组件自动拉起来一个弥补上原来所需要三个的实例&xff0c;包括一些自愈、扩缩容等能力&xff0c;对应在第 3 层。最后一层则是平台层&xff0c;包括了所有底层的核心功能&xff0c;负责对工作负载...
    文章 2020-01-03 463浏览量
  • 如何做到全年配送 0 故障?盒马揭秘 12个关键技术

    我们的开关基本都是单例在多线程环境中使用,开关发布要注意数据的可见性,比较复杂的数组或map结构,推荐使用影子实例完成开关状态变更。(5)开关接入changefree 开关变更最好接入changefree,审批人要设置多个,...
    文章 2020-02-18 660浏览量
  • 分布式数据库选型——数据水平拆分方案

    这个方案优点是保障了数据在多个副本中存在,高可用时有候选副本,也不用担心挂掉一个备副本会影响主副本。它的缺点是不能自动知道哪个候选副本拥有主副本最新最全的数据,也不强制要求两个备副本都要拥有全部数据。...
    文章 2019-08-08 2645浏览量
  • 《叶问》第1期

    一、导致主从不一致的原因主要有: 1、人为原因导致从库与主库数据不一致(从库写入)2、主从复制过程中,主库异常宕机3、设置了ignore/do/rewrite等replication等规则4、binlog非row格式5、异步复制本身不保证,半...
    文章 2018-11-29 1380浏览量
  • 分布式数据库选型——数据水平拆分方案

    这个方案优点是保障了数据在多个副本中存在,高可用时有候选副本,也不用担心挂掉一个备副本会影响主副本。它的缺点是不能自动知道哪个候选副本拥有主副本最新最全的数据,也不强制要求两个备副本都要拥有全部数据。...
    文章 2019-06-19 20609浏览量
  • MaxCompute/Dataworks云数仓高可用最佳实践

    MaxCompute官方文档DataWorks官方文档:DataWorks官方文档一、logview排查作业在日常的开发过程中我们偶尔会发现某些任务突然耗时比较长,或者某些任务突然挂掉需要排查原因。Logview将用来协助我们完成这件事情。...
    文章 2020-07-23 1263浏览量
  • 如何像智能机一样管理云端应用?...

    这么做的原因也非常明朗:作为未来云计算应用管理生态的基础性模型,Open Application Model 从一开始就采用完全中立和开放的方式同整个社区协作,并计划在项目稳定后便移交给中立基金会进行托管。目前,OAM 已经在...
    文章 2019-10-18 3021浏览量
  • 像智能手机一样管理云端应用:阿里云联合微软全球首发...

    这么做的原因也非常明朗:作为未来云计算应用管理生态的基础性模型,Open Application Model 从一开始就采用完全中立和开放的方式同整个社区协作,并计划在项目稳定后便移交给中立基金会进行托管。目前,OAM 已经在...
    文章 2019-10-21 1127浏览量
  • 今日头条在消息服务平台和容灾体系建设方面的实践与...

    如果不在客户端做压缩,这还是涉及到 RPC 的问题,RPC 一般来说,Byte 类型,就是 Byte 数组类型它是不会进行压缩的,只是会进行一些常规的编码,所以消息体需要在客户端做压缩。如果放在 Proxy 这边做,Proxy 压力...
    文章 2019-11-04 2521浏览量
  • 云时代下的数据库存储——运筹帷幄的阿里云数据库...

    另外两个备节点依然从主节点上去同步数据,跟之前所不同的是一旦三个机房的其中一个出现了非常严重的自然灾害导致整个机房挂掉之后,MongoDB目前所支持的一个HA高可用系统会直接将应用流量从挂掉的实例切换到另外两...
    文章 2018-01-28 6618浏览量
  • 日志系统之基于Zookeeper的分布式协同设计

    临时:当一个工作者线程挂掉之后,它本地的Zookeeper会话也会随之失效,在其会话失效之后,临时节点将会消失。顺序:它能仲裁出创建path的客户端的先后顺序,并在新建的path中追加标识 各个工作者线程创建临时顺序的...
    文章 2017-11-21 1030浏览量
  • 蚂蚁金服 ZSearch 在向量检索上的探索

    向量从表现形式上就是一个一维数组。我们需要解决的问题是使用下面的公式度量距离寻找最相似的 K 个向量。欧式距离: 两点间的真实距离,值越小,说明距离越近;余弦距离: 就是两个向量围成夹角的 cosine 值,...
    文章 2019-12-19 1191浏览量
  • Spring Cloud Turbine(集群监控)

    简介: Turbine是聚合服务器发送事件流数据的一个工具,Hystrix的监控中,只能监控单个节点,实际生产中都为集群,因此可以通过Turbine来...如果其中一个集群服务挂掉了,监控有有所显示 各种指标的相关说明 image.png
    文章 2018-08-07 2924浏览量
  • aix topas

    操作系统的最全面动态,而又查看方便的性能视图就是topas命令了,下面以topas输出为例,对AIX系统的性能监控做简要描述,供运工程师和系统管理员们参考。...如果该数值持续增长,系统一定会挂掉的
    文章 2011-01-18 1390浏览量
  • 微服务架构上云最佳实践

    说到这里可能有同学已经猜出来了是怎么回事了,这里我简单简述一下造成这个问题的原因,首先要从服务器端主动关闭连接的 TCP TIMEWAIT 状态开始说起,顾名思义,这个状态是在等,等什么呢?确保 Server 的最后一个 ...
    文章 2017-08-01 8247浏览量
  • Codis作者黄东旭:细说分布式Redis架构设计和那些踩过...

    所以,你可能看出来了,其实Codis的HA,并不能保证数据完全不丢失,因为是异步复制,所以master挂掉后,如果有没有同步到slave上的数据,此时将slave提升成master后,刚刚写入的还没来得及同步的数据就会丢失。...
    文章 2017-05-02 2666浏览量
  • Linux集群和自动化运

    3.2 选择Python的原因83 3.3 Python的版本说明83 3.4 增强的交互式环境IPython84 3.5 Python(x,y)介绍85 3.6 轻量级自动化运工具Fabric介绍86 3.6.1 Fabric的安装87 3.6.2 命令行入口fab命令详解88 3.6.3 ...
    文章 2017-05-02 5184浏览量
  • PostgreSQL CDC的最佳实践

    所以replication slot就是要解决我们事务日志被清理掉的问题。l 逻辑解码 刚才讲到逻辑复制的原理&xff0c;那么它到底是怎么去做解码的&xff1f;比如说我们创建一个复制槽&xff0c;刚才说了我们使用逻辑复制一定要有逻辑...
    文章 2021-03-29 275浏览量
  • 后端架构师技术图谱

    链表、数组 字典、关联数组 栈 树 二叉树 完全二叉树 平衡二叉树 二叉查找树(BST) 红黑树 B-,B+,B*树 LSM 树 BitSet 常用算法 排序、查找算法 选择排序 冒泡排序 插入排序 快速排序 归并排序 希尔排序 堆排序 ...
    文章 2018-05-07 6277浏览量
  • Redis原理详解

    上面已经说到Redis Hash对应Value内部实际就是一个HashMap,实际这里会有2种不同实现,这个Hash的成员比较少时Redis为了节省内存会采用类似一维数组的方式来紧凑存储,而不会采用真正的HashMap结构,对应的value ...
    文章 2017-11-12 2255浏览量
1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化