• 关于

    维护策略常见故障

    的搜索结果
  • 【剖析 | SOFARPC 框架】之SOFARPC 单机故障剔除剖析

    一. 前言 对于金融业务而言每个环节都涉及到大量的资金操作,若因为网络、硬件等原因导致系统不稳定性,不仅影响用户体验,更重要的是可能会引起资损问题,因此系统可用性至关重要。在微服务分布式架构中提高系统可用性的常见方案是 __集群(冗余)。 __集群方式将一个服务部署在多个机器上,通过硬负载或软负载...

    文章 花肉酱 2018-11-02 1004浏览量

  • 【剖析 | SOFARPC 框架】系列之 SOFARPC 单机故障剔除剖析

    SOFA Scalable Open Financial Architecture 是蚂蚁金服自主研发的金融级分布式中间件,包含了构建金融级云原生架构所需的各个组件,是在金融场景里锤炼出来的最佳实践。 本文为《剖析 | SOFARPC 框架》第六篇,作者畅为。 《剖析 | SOFARPC 框架》...

    文章 初商 2019-08-03 343浏览量

  • 降低数据中心的复杂性:运用基于策略的管理

    策略能够让IT团队更有效地管理虚拟机的可用性、安全性以及其他组件。企业可以采取本文提及的策略来降低数据中心 的复杂性。 随着数据中心的不断发展,变得越来越复杂,使用软件来代替人员管理这种复杂性更加有效的同时,也更具性价比。 因此,基于策略的管理已成为数据中心管理员们的基本技能。无论您是使用超级融合...

    文章 知与谁同 2017-08-02 859浏览量

  • 降低数据中心的复杂性:运用基于策略的管理

    策略能够让IT团队更有效地管理虚拟机的可用性、安全性以及其他组件。企业可以采取本文提及的策略来降低数据中心 的复杂性。 随着数据中心的不断发展,变得越来越复杂,使用软件来代替人员管理这种复杂性更加有效的同时,也更具性价比。 因此,基于策略的管理已成为数据中心管理员们的基本技能。无论您是使用超级融合...

    文章 知与谁同 2017-07-03 767浏览量

  • 企业需要避免7种常见的云计算数据管理陷阱

    企业将应用程序和工作负载迁移到云中,有许多令人信服的理由,例如从可扩展性到易于维护等,但迁移数据绝不是没有风险的。当IT系统或应用程序宕机或中断时,它可能会为企业带来代价高昂的损失。根据ITIC的调查,98%的组织表示,其一小时的停机成本超过10万美元。 企业在竞争中很容易犯错误。有很多事情可能会...

    文章 技术小能手 2018-05-18 1230浏览量

  • 避免7种常见的云数据管理陷阱

    企业将应用程序和工作负载迁移到云中有许多令人信服的理由——从可扩展性到易于维护等,但迁移数据绝不是没有风险的。当IT系统或应用程序宕机时,它可能会为企业带来极高的成本损失。据ITIC的一项调查结果显示,98%的组织称其一小时的停机成本超过10万美元。 企业在竞争中很容易犯错误。当然,也有很多事情可...

    文章 技术小能手 2018-05-24 1308浏览量

  • 这可能是史上最全 Redis 高可用解决方案总结

    本文主要针对 Redis 常见的几种使用方式及其优缺点展开分析。一、常见使用方式 Redis 的几种常见使用方式包括: 1. Redis 单副本;2. Redis 多副本(主从);3. Redis Sentinel(哨兵);4. Redis Cluster; 5. Redis 自研。 二、各种使用...

    文章 技术小能手 2018-09-29 2699浏览量

  • 这可能是史上最全 Redis 高可用解决方案总结

    本文主要针对 Redis 常见的几种使用方式及其优缺点展开分析。 一、常见使用方式 Redis 的几种常见使用方式包括: Redis 单副本; Redis 多副本(主从); Redis Sentinel(哨兵); Redis Cluster; Redis 自研。 二、各种使用方式的...

    文章 java填坑路 2018-09-30 1418浏览量

  • 这可能是目前最全的Redis高可用技术解决方案总结

    本文主要针对Redis常见的几种使用方式及其优缺点展开分析。 一、常见使用方式 Redis的几种常见使用方式包括: • Redis单副本;• Redis多副本(主从);• Redis Sentinel(哨兵);• Redis Cluster;• Redis自研。 二、各种使用方式的优缺点 1、Re...

    文章 技术小能手 2018-08-21 18385浏览量

  • VMware vSphere常见问题汇总(十二)

    110、尝试使用附加的 USB 设备迁移虚拟机时的错误消息 将多个 USB 设备从 ESXi 主机连接到虚拟机且一个或多个设备未启用 vMotion 功能时,通过 vMotion 进行迁移将无法继续并会发出一条并不十分明确的错误消息。 故障状态: 迁移虚拟机向导会在迁移操作开始之前运行兼容性检查。...

    文章 科技小能手 2017-11-14 1167浏览量

  • 《Windows Server 2012活动目录管理实践》 内容提要、前言

    内容提要 Windows域的核心价值是身份验证系统。域从出现(Windows NT)到现在(Windows Server 2012 AD DS域服务)已经经过了15年的时间,从初期单纯身份验证功能到现在的企业管理中枢,已经成为企业的管理平台、基础架构平台,为ITPro提供更丰富的功能。本书以Win...

    文章 技术小甜 2017-11-09 688浏览量

  • 细说 Azure Storage 的冗余策略

    当我们想要把应用搬到云端的时候,首先要关注的便是数据的安全性。当然所有的云服务厂商都会对用户数据承诺一个非常高的安全性,但万一出现意外呢?我们是不是还要有适当的应对方案?比如今年的3月8日晚间,Azure 某个区域中的存储几乎全部不能访问,持续达两个多小时。当时最担心的是:用户的数据万一丢掉怎么办...

    文章 吞吞吐吐的 2017-10-04 1024浏览量

  • SQL Server备份和还原

        对于生产数据来讲,数据的安全性是至关重要的,任何数据的丢失都可能产生严重的的后果。而备份作为数据的副本,可以有效的保护和恢复数据 数据丢失的原因     数据丢失的原因主要包括以下几类: (1)程序错误。例如,程序异常终止或逻辑错误等 (2)人为错误。例如,用户或管理员误操作 (3)计...

    文章 余二五 2017-11-23 773浏览量

  • 数据中心业务中断 多与运营流程有关

    TiePoint-BKM工程设备公司运营解决方案总监David Boston表示,三分之二的数据中心业务中断与其运营流程有关,而不是基础设施系统。如今,许多关键行业在发展和运营过程中投入了大量的时间和资源进行培训和教育,如核工业,军事和民用航空,甚至是司机,而数据中心行业却没有这么多的时间和资源进...

    文章 知与谁同 2017-07-04 667浏览量

  • 数据中心业务中断 多与运营流程有关

    TiePoint-BKM工程设备公司运营解决方案总监David Boston表示,三分之二的数据中心业务中断与其运营流程有关,而不是基础设施系统。 如今,许多关键行业在发展和运营过程中投入了大量的时间和资源进行培训和教育,如核工业,军事和民用航空,甚至是司机,而数据中心行业却没有这么多的时间和资源...

    文章 晚来风急 2017-08-02 745浏览量

  • 走近华佗,解析自动化故障处理系统背后的秘密

    集群医生华佗是集群自动化故障监测和处理系统,是平台和运维对接的关键系统。一方面完成飞天其他组件不擅长的OS和硬件的故障自动监测和处理,另一方面推动飞天去及时规避硬件和OS引起的故障,使得故障能够闭环运转,大幅度减少故障处理成本和造成的影响。飞天5K项目期间的规模效应凸显出自动化处理故障的必要性,大...

    文章 yq传送门 2016-12-18 4475浏览量

  • Linux HA集群

    HA(High Availability,高可用)集群的主要目的是提高服务的在线率,也就是缩短平均无故障的时间。实际上就是当一个提供服务的服务节点不在线时,有另一个提供相同服务的节点可以继续提供服务,避免出现单点故障。 HA集群相关概念 一、相关名词解释 1、在线率 在线率是衡量HA集群的一个重要...

    文章 余二五 2017-11-16 913浏览量

  • 如何有效可靠地管理大规模 Kubernetes 集群?

    前言 Kubernetes 以其超前的设计理念和优秀的技术架构,在容器编排领域拔得头筹。越来越多的公司开始在生产环境部署实践 Kubernetes,在阿里巴巴和蚂蚁金服 Kubernetes 已被大规模用于生产环境。 Kubernetes 的出现使得广大开发同学也能运维复杂的分布式系统,它大幅降低...

    文章 缪克卢汉 2019-08-15 829浏览量

  • 史上最全Redis高可用技术解决方案大全

    继采访 “对话张冬洪 | 全面解读NoSQL数据库Redis的核心技术与应用实践” 发出后,很多朋友向我咨询关于里面提到的高可用的方案的优缺点以及如何选择合适的方案线上使用,刚好最近在给宜人贷,光大银行做企业内训的时候也详细讲过(广告一下:极数云舟不仅提供企业培训、技术咨询、解决方案,还有项目产品...

    文章 技术小能手 2018-11-16 1689浏览量

  • 稳定性保障6步走:高可用系统大促作战指南!

    作者 | 雍雍来源 | 阿里技术公众号一 前言年年有大促,大家对于大促稳定性保障这个词都不陌生,业务场景尽管各不相同,“套路”往往殊路同归,全链路压测、容量评估、限流、紧急预案等,来来去去总少不了那么几板斧。跳出这些“套路”,回到问题的本质,我们为什么要按照这些策略来做?除了口口相传的历史经验,我...

    文章 开发者小助手_LS 2021-03-08 1482浏览量

  • 阿里云栖开发者沙龙PHP技术专场-聊聊服务稳定性保障这些事

    摘要:本文主要带大家了解服务稳定性的重要性和相关策略。策略大概分两部分,第一方面从架构层面介绍保障服务稳定性的常见策略(限流,降级,隔离,超时,重试和集群)。第二个方面是从流程方面(code review, 压测,灰度和监控)讲解怎么去保证稳定性。 演讲嘉宾简介:信海龙(花名沧龙),十余年的互联网...

    文章 PHP小能手 2019-04-25 2238浏览量

  • linux高可用集群(HA)原理详解

    linux高可用集群(HA)原理详解 原文:http://www.mamicode.com/info-detail-416675.html               标签:高可用集群  高可用集群原理介绍   高可用集群组件 高可用集群 一、什么是高可用集群         高可用集群就是当某...

    文章 技术小胖子 2017-10-10 1114浏览量

  • VMware vSphere 5.1 群集深入解析(七)

    第七章 虚拟机和应用监控 虚拟机和应用监控是一个经常被人忽视,但又确实是HA的一个强大功能,可能由于它是HA的新功能、新组件,且通常默认配置下该功能没被启用。我们将试图收集所有虚拟机和应用监控的相关信息,但它是一个非常简单的产品,实际不是你期望的那样。 图40:虚拟机与应用监控 为什么你需要虚拟...

    文章 余二五 2017-11-09 938浏览量

  • 如何提高阿里云上应用的可用性(二)

    这是如何提高阿里云上应用的可用性系列文章的第二篇,第一篇传送门。 在单体应用时代,最大的问题是如何解决数据库瓶颈,而微服务之下,一个大应用被拆分成了几十个甚至上百个微服务,数据访问的压力被传导到了服务之间的网络,服务强弱依赖,服务雪崩等各种问题随之而来,那么如何保障服务的可用性以及整个应用的健壮性...

    文章 中间件小哥 2018-11-01 1864浏览量

  • 详解数据中心网络高可用的技术

    一、高可用性的定义 系统可用性(Availability)的定义公式为:Availability=MTBF/(MTBF+MTTR)×100% MTBF(MeanTimeBetweenFailure),即平均无故障时间,是描述整个系统可靠性(reliability)的指标。对于一个网络系统来说,MT...

    文章 青衫无名 2017-08-01 2038浏览量

  • linux高可用性架构概述

    高可用集群的衡量标准     HA(High Available), 高可用性群集是通过系统的可靠性(reliability)和可维护性(maintainability)来度量的。工程上,通常用平均无故障时间(MTTF)来度量系统的可靠性,用平均维修时间(MTTR)来度量系统的可维护性。于是可用性...

    文章 技术小甜 2017-11-14 977浏览量

  • 微服务架构的基础设施

    一、服务发现微服务种类和数量很多,如果这些信息全部通过手工配置的方式写入各个微服务节点,首先配置工作量很大,配置文件可能要配几百上千行,几十个节点加起来后配置项就是几万几十万行了,人工维护这么大数量的配置项是一项灾难;其次是微服务节点经常变化,可能是由于扩容导致节点增加,也可能是故障处理时隔离掉一...

    文章 songhk487 2020-06-01 297浏览量

  • Service Mesh 高可用在企业级生产中的实践

    Service Mesh Virtual Meetup 是 ServiceMesher 社区和 CNCF 联合主办的线上系列直播。本期为 Service Mesh Virtual Meetup#1 ,邀请了四位来自不同公司的嘉宾,从不同角度展开了 Service Mesh 的应用实践分享,分享涵盖...

    文章 花肉酱 2020-06-03 182浏览量

  • 微服务技术栈:流量整形算法,服务熔断与降级

    一、流量控制 1、基本概念 流量控制的核心作用是限制流出某一网络的某一连接的流量与突发,使这类报文以比较均匀的速度流动发送,达到保护系统相对稳定的目的。通常是将请求放入缓冲区或队列内,然后基于特定策略处理请求,匀速或者批量处理,该过程也称流量整形。 流量控制的核心算法有以下两种:漏桶算法和令牌桶算...

    文章 知了一笑 2020-06-28 437浏览量

  • 移动应用测试计划

    确定功能和属性 User story: A high-level user or business requirement commonly used in Agile software development, typically consisting of one or more senten...

    文章 python人工智能命理 2019-04-16 1181浏览量

1 2 3 4 ... 13 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT