• 掌门教育微服务体系 Solar|阿里巴巴 Nacos 企业级落地...

    至此,经过 2 个月左右的努力付出,Eureka 和 Nacos 同步运行稳定,PROD 环境上同步将近 660 个服务(实例数),情况良好。非常重要的提醒:一致性 Hash 的虚拟节点数,在所有的 Nacos Sync Server 上必须保持一致...
    文章 2020-08-03 1051浏览量
  • 掌门教育微服务体系 Solar|阿里巴巴 Nacos 企业级落地...

    至此,经过 2 个月左右的努力付出,Eureka 和 Nacos 同步运行稳定,PROD 环境上同步将近 660 个服务(实例数),情况良好。非常重要的提醒:一致性 Hash 的虚拟节点数,在所有的 Nacos Sync Server 上必须保持一致...
    文章 2020-08-03 433浏览量
  • 应用容灾中,MySQL数据表是否需要跨云同步

    容灾应用备中心资源限制:实际项目中,受限于备中心的资源限制,无法在备中心内部署应用系统,因此容灾的应用对应的数据库和数据表无需同步。运维临时备份库和备份表无需同步:在日常运维中,DBA在对数据库进行...
    文章 2021-03-12 3716浏览量
  • 如何提高微服务架构的可用性

    当某个微服务发生故障时,如何确保不会导致其他依赖的微服务不可用,如何确保系统自动降级把发生故障的微服务排除出去,如何确保故障不会扩展到整个系统?那么如何有效确保微服务架构的可用性将会成为挑战。下图是...
    文章 2016-08-08 6009浏览量
  • Oracle 12.2新特性掌上手册-第一卷 Availability

    DUPLICATE功能增强的目的是是排除类似限制,并且当目标数据库是primary数据库或物理standby数据库时,会允许同一组操作。此增强功能利用现有物理standby数据库进行更多用途,从primary数据库卸载。9、Data-Dependent...
    文章 2017-07-18 1502浏览量
  • RPC-client异步收发核心细节?

    回答:同步阻塞发送,可以直接使用带超时的send/recv来实现,异步阻塞的nio的网络报文收发,如何实现超时接收呢?(由于连接不会一直等待回包,那如何知晓超时呢?这时,超时管理器就上场啦。超时管理器 超时管理...
    文章 2019-08-12 630浏览量
  • golang 服务大量 CLOSE_WAIT 故障排查

    查看机器监控,发现故障期间 socket fd 升高到了3w多,随着fd升高内存也在持续占用,但是远没有到系统瓶颈,_DB_、_redis_还是出现故障窗口期间 qps 同步下掉的情况。这个程序是两台机器,出故障只有一台机器,周五...
    文章 2020-01-26 1096浏览量
  • 《架构师》反思:系统可靠性

    软件确认技术则主要着眼于排除程序代码中的错误。目前支持很好的自动化。工程质量的把控,主要依靠测试管理,分为:“软件测试团队组织管理、软件测试计划管理、软件缺陷(错误)跟踪管理以及软件测试件管理”四大...
    文章 2016-05-05 4854浏览量
  • 高德服务单元化方案和架构实践

    单元路由服务采用什么样的部署方案是我们另一个要面临的问题,考虑过以下三种方案:第一种SDK的方式因为对业务的强侵入性是首先被排除的,统一接入层进行代理和去中心化插件集成两种方案各有利弊,但当时首批要接入...
    文章 2019-11-25 7955浏览量
  • rsync与inotify集成实现数据实时同步更新

    这样就可能会导致服务端和客户端数据出现不一致的情况,无法在应用出现故障时完全恢复数据。基于以上原因,所以就考虑采用rsync与inotify集成的方式来解决这些问题。二、inotify是什么 inotify是一种强大的、细粒度...
    文章 2016-05-12 4259浏览量
  • Mongodb Manual阅读笔记:CH8 复制集

    8.3.4复制集故障排除.36 8.3.4.1检查复制状态.36 8.3.4.2检查复制延迟.36 8.3.4.3测试成员之间的连接.36 8.3.4.4多个成员重启导致socket异常.36 8.3.4.5检查oplog大小.37 8.3.4.6 Oplog文档时间戳错误.37 8.3.4.7...
    文章 2014-03-21 1364浏览量
  • 函数组合的N种方式

    可视化监控:FnF 提供了可视化界面来协助定义流程和查看执行状态,方便您快速识别故障位置,并快速排除故障问题。运维全托管和按需付费:FnF 让您从基础设施维护中解放出来,提供了安全的、高可用的、高容错的弹性...
    文章 2019-10-25 1438浏览量
  • golang 服务诡异499、504网络故障排查

    报警当时200占比已经过10%并且在持续升高,根据历史规律应该很快就会恢复,我们稍微观察了几分钟(一边吃着很香的饺子一边看着手机),但是过了几分钟故障没有恢复而且占比升高了突破50%,故障逐渐升级(故障如果...
    文章 2019-11-16 4637浏览量
  • 函数组合的 N 种模式

    可视化监控:FnF 提供了可视化界面来协助定义流程和查看执行状态,方便您快速识别故障位置,并快速排除故障问题。运维全托管和按需付费:FnF 让您从基础设施维护中解放出来,提供了安全的、高可用的、高容错的弹性...
    文章 2020-01-19 490浏览量
  • 一文读懂分布式架构知识体系(内含超全核心知识大图)

    分布式架构的根基就是网络,不管是局域还是公网,没有网络就无法把计算机联合在一起工作,但是网络也带来了一系列的问题。网络消息的传播有先后,消息丢失和延迟是经常发生的事情,我们定义了三种网络工作模式: ...
    文章 2019-10-16 6106浏览量
  • Lsyncd-实时文件同步工具(精译)

    它聚集并组合事件几秒钟,然后生成一个(或多个)进程(es)来同步这些更改。默认情况下,这是rsync。因此Lsyncd是一个轻量级的实时镜像解决方案,相对而言易于安装,不需要新的文件系统或块设备,也不会影响本地...
    文章 2018-05-01 2422浏览量
  • 存储-盘古,阿里云飞天分布式存储系统设计深度解析

    解决上述问题的方案是使用线程同步原语同时支持协程和协程用户。在协程中是不切线程的,所以意味着所有的Task都在一个线程中执行,如果任何一个Task有阻塞操作,都会导致整个线程吞吐率的降低。
    文章 2017-07-19 6375浏览量
  • 《Cisco安全防火墙服务模块(FWSM)解决方案》——2.6...

    本节书摘来异步社区《Cisco安全防火墙服务模块(FWSM)解决...在用户理解了数据包流过FWSM的方式,以及每一个功能的作用位置之后,就会更清楚FWSM应该部署在网络中的哪个地方,而且也有助于用户更为迅速地排除故障
    文章 2017-05-02 1478浏览量
  • 盘古:阿里云飞天分布式存储系统设计深度解析

    解决上述问题的方案是使用线程同步原语同时支持协程和协程用户。在协程中是不切线程的,所以意味着所有的Task都在一个线程中执行,如果任何一个Task有阻塞操作,都会导致整个线程吞吐率的降低。欢迎加入MaxCompute...
    文章 2016-11-17 38126浏览量
  • 离不开的微服务架构,脱不开的RPC细节(值得收藏)!

    连接池中建立了与一个RPC-server集群的连接,当连接池发现某一个机器的连接异常后,需要将这个机器的连接排除掉,返回正常的连接,在机器恢复后,再将连接加回来。如何实现发送超时?因为是同步阻塞调用,拿到一个...
    文章 2019-08-08 1158浏览量
  • 离不开的微服务架构,脱不开的RPC细节(值得收藏)!

    连接池中建立了与一个RPC-server集群的连接,当连接池发现某一个机器的连接异常后,需要将这个机器的连接排除掉,返回正常的连接,在机器恢复后,再将连接加回来。如何实现发送超时?因为是同步阻塞调用,拿到一个...
    文章 2020-02-04 301浏览量
  • NameNode安全模式问题,ntp时间服务同步,机架感知配置

    第二种方式:同步到局域内部的一台时间同步服务器 一、搭建时间同步服务器 1、编译安装ntp server rpm-qa|grep ntp 若没有找到,则说明没有安装ntp包,从光盘上找到ntp包,使用 rpm-Uvh ntp*.rpm 进行安装 2、修改...
    文章 2017-05-29 2456浏览量
  • 《Cisco BGP-4 命令与配置手册》——导读

    当命令不能按照预期进行工作时,如何对命令进行故障排除。用来演示BGP命令的案例场景可以在最小数量的路由器上实施。这使得读者不需要使用大量而且昂贵的实验配置就能够学习每一个命令。这些场景都在书中有所体现,...
    文章 2017-05-02 1447浏览量
  • 每秒8.8亿次请求!让数据存得起,看得见-云原生多模...

    一、引言 2020双十一顺利落下帷幕,这也是云原生多模数据库...在集团内部,Lindorm拥有全前列的离在线数据同步流量。依赖LTS(Lindorm Tunnel Service)服务,每天有接近670+TB,约3.2万亿条记录来源于其他数据源的导入...
    文章 2020-11-25 1747浏览量
  • SpringCloud学习1-服务注册与发现(Eureka)

    它允许在分片发生故障的时候继续提供服务的发现和注册,当故障分配恢复时,集群中的其他分片会把他们的状态再次同步回来。集群中的的不同服务注册中心通过异步模式互相复制各自的状态,这也意味着在给定的时间点每个...
    文章 2018-03-04 1671浏览量
  • Java Web技术架构方案概述

    在2012版本中,IK 实现了简单的分词歧义排除算法,标志着 IK 分词器从单纯的词典分词向模拟语义分词衍化。Solr如何使用?我们可以利用Spring将Solr服务集成到项目中。Spring Data Sol就是为了方便Solr的开发所研制的...
    文章 2020-03-12 1191浏览量
  • 从分布式一致性算法到区块链共识机制

    显而易见,解决故障类错误更容易一些,通常把这类一致性算法叫做故障容错算法(Crash Fault Tolerance)或者拜占庭容错算法。而拜占庭类错误,因为有恶意篡改的可能性存在,复杂性更高、解决难度更大,通常把解决...
    文章 2019-05-13 2551浏览量
  • 云原生时代下的12要素

     判断一个应用是否正确地将配置排除在代码之外,一个简单的方法,看该应用的基准代码是否可以立刻开源,而不用担心会暴露任何敏感的信息。4.后端服务:把后端服务当作附加资源(backing services) 后端服务是指程序...
    文章 2019-12-27 1588浏览量
  • 搞懂分布式系统27:消息队列设计精要总结之高级特性篇

    5:消息类型选择:所以,一个完整的消息队列应该定义清楚自己可以投递的消息类型,如事务型消息,本地持久型消息,以及服务端不落地的可靠消息等。对不同的业务场景做不同的选择。另外事务的使用应该尽量低成本...
    文章 2018-07-13 1237浏览量
  • 一文解析区块链可运维性的六大误解

    也就是说,当分叉遇到跨链,分叉会把本来在一条区块链内的运维问题传导到另外的区块链中去,变成一个全的运维问题,从而大大增加全的运维难度。所以,从可运维性的基本理念出发,不应该听任动辄分叉,而应该利用...
    文章 2018-04-19 1108浏览量
1 2 3 4 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化