• 如何设计高可用系统之故障隔离

    数据库执行 SQL,如果不设置超时时间,当出现不合理的慢 SQL 时,很快耗尽连接池,新的业务请求拿不到连接,就一直挂起等待,很快你的线程池和请求队列被占满,系统严重不可用。如果请求队列连是无界队列,则...
    文章 2019-08-06 1223浏览量
  • 云产品推出可用区

    可用区是同一地域下(如杭州),电力和网络互相独立的物理区域(一般是一个物理机房),目标是能够保证可用区间故障相互隔离(大型灾害或者大型电力故障除外),不出现故障扩散,使得用户的业务应用持续在线服务。...
    文章 2014-07-23 1638浏览量
  • 没有服务台,就没有ITSM

    如果没有,那我想我们的运维体系依然是存在严重隐患的,因为当我们在处理小的问题或故障的时候,我们可能忽略那种重要的业务故障。综上所述,其实我们在讨论的是一个运维人员成本和问题快速响应之间的一个矛盾,一...
    文章 2017-11-12 1177浏览量
  • IBM和SAP合力打造美国的物联网时代

    IBM Power Systems提供了x86架构的四倍内存带宽,这有利于内存密集SAP HANA操作,每个Power System处理器内核最多可以执行八个并发线程,而一般的x86平台每个内核只有两个线程。此外由于IBM硬件系统更大的处理器...
    文章 2017-07-03 875浏览量
  • Linux下集群技术应用概述

    适用于业务繁忙、大负荷访问的应用系统,但是它也有不足的地方:当一个节点出现故障时,前端调度系统并不知道此节点已经不能提供服务,仍然把客户端的请求调度到故障节点上来,这样访问就失败,为了解决这个问题...
    文章 2017-11-15 1235浏览量
  • ITIL部署实施系列之变更管理

    5、正式的系统变更操作,应安排在系统非工作时间进行,以腾出时间处理万一出现故障。本文转自 zhaiken 51CTO博客,原文链接:http://blog.51cto.com/zhaiken/528298,如需转载请自行联系原作者
    文章 2017-11-27 1391浏览量
  • 没有服务台就没有ITSM

    如果没有,那我想我们的运维体系依然是存在严重隐患的,因为当我们在处理小的问题或故障的时候,我们可能忽略那种重要的业务故障。综上所述,其实我们在讨论的是一个运维人员成本和问题快速响应之间的一个矛盾,一...
    文章 2017-11-08 1055浏览量
  • 稳定性保障6步走:高可用系统大促作战指南!

    考虑到成本最小化,非常规增量P计算时一般无需与常规业务流量W一起,全量纳入叠加入口流量K,一般会将非常规策略发生概率λ作为权重,即:2)节点流量节点流量由入口流量根据流量分支模型,按比例转化而来。...
    文章 2021-03-08 1958浏览量
  • linux下集群技术介绍

    适用于业务繁忙、大负荷访问的应用系统,但是它也有不足的地方:当一个节点出现故障时,前 端调度系统并不知道此节点已经不能提供服务,仍然把客户端的请求调度到故障节点上来,这样访问就失败,为了解决这个...
    文章 2017-11-12 1210浏览量
  • IBM和SAP合力打造美国的物联网时代

    IBM Power Systems提供了x86架构的四倍内存带宽,这有利于内存密集SAP HANA操作,每个Power System处理器内核最多可以执行八个并发线程,而一般的x86平台每个内核只有两个线程。  此外由于IBM硬件系统更大的...
    文章 2016-11-18 761浏览量
  • 服务 托管呼叫中心的核心竞争力

    由于托管呼叫中心是服务商建好一个大的呼叫中心平台,在这个平台上要跑很多企业的呼叫中心业务,这些企业的所有呼叫电话都要通过这个平台来实现IVR、自动呼叫分配(ACD)、来电弹屏、录音等功能,并且接入到这个...
    文章 2017-07-04 930浏览量
  • 服务 托管呼叫中心的核心竞争力

    由于托管呼叫中心是服务商建好一个大的呼叫中心平台,在这个平台上要跑很多企业的呼叫中心业务,这些企业的所有呼叫电话都要通过这个平台来实现IVR、自动呼叫分配(ACD)、来电弹屏、录音等功能,并且接入到这个...
    文章 2017-07-04 1083浏览量
  • SOFARPC 性能优化实践(下)|SOFAChannel#3 直播整理

    一般 RPC 默认场景。IO 线程池识别出来当前是哪个类,调用用户注册的对应处理器 反序列化 ClassName 和 Header 仅反序列化 Content 和业务处理 希望根据 Header 中的信息,选择线程池,而不是直接注册的线程池 一次...
    文章 2019-03-01 1016浏览量
  • 性能测试与故障诊断

    还有些时候,硬件故障可以直接导致性能的下降,特别是在压力测试过程中,经常出现由于硬件原因导致无法访问服务器的现象,对于存在负载均衡的应用系统来说,故障虽不致于使系统处于瘫痪状态,但是却使得所有的压力...
    文章 2017-11-15 1204浏览量
  • 支付系统如何进行分布式改造

    在高可用方面,核心思想之一是“解决一切单点”,单点容易出现故障,性能方面也可能成为瓶颈,因此需要将单点改造拆分成多个点。垂直拆分能更清晰化模块划分,区分治理,水平切分能解决大数据量性能瓶颈问题,分布式...
    文章 2019-08-03 805浏览量
  • 如何做好一名稳定性SRE-业务团队系统稳定性的思与行

    区分责任,当出现故障时,区分清楚责任,到底是稳定性工作没有做到位,还是做到位了,但是团队同学疏忽了,还是说只是单纯的业务变化;1.3,开发和SRE的区别 都是做技术的,很多开发刚刚转向负责稳定性时,有些弯转...
    文章 2020-10-26 5354浏览量
  • 十分钟了解阿里云数据库RDS

    追求极致性能但对价格不敏感的客户一般会在重要业务系统采用独占实例。关于通用和独享实例的性能,我们以MySQL 5.6实例做了基准实测,可参见如下结果。应用上云 现有业务系统的数据库有可能跑在自己的机房、...
    文章 2019-06-08 10284浏览量
  • 十分钟教你了解阿里云数据库RDS

    追求极致性能但对价格不敏感的客户一般会在重要业务系统采用独占实例。关于通用和独享实例的性能,我们以MySQL 5.6实例做了基准实测,可参见如下结果。应用上云 现有业务系统的数据库有可能跑在自己的机房、...
    文章 2020-07-16 531浏览量
  • net 大型分布式电子商务架构说明

    每个公司对监控的需求其实都不一样,一般会根据业务不同,根据架构不同,根据基础服务不同,会不同程度的抓取和集成一些性能指标,业务日志,错误日志,耗时性能,流量等等至监控平台。市面上有很多大而全的监控平台...
    文章 2017-06-05 1760浏览量
  • 分布式主动感知在智能运维中的实践

    但这样处理,下次可能还会出现同样的问题。如果将故障放到ITSM部分进行分析,就能让问题得到更根本的解决。发现故障后,通过请求管理把这件事告诉后台人员,后台人员看到请求后将故障升级为“事件”并提交给研发人员...
    文章 2019-07-09 2307浏览量
  • HBase在腾讯大数据的应用实践

    就在不久前,支付宝、携程、蓝翔就因不同原因出现了网络故障,紧随其后艺龙网,途牛网、去哪儿网纷纷遭到大流量DDoS攻击,并造成短暂的业务中断。其中携程中断近12个小时,根据携程一季度财报公布的数据,折算每小时...
    文章 2015-06-12 2232浏览量
  • 从底层技术来看,GSLB 究竟难在哪儿

    当某个集群出现故障时,该集群对外通告的 VIP 被撤回,路由更新之后,之前该集群服务的用户请求被自动路由到次优集群,这对用户来说都是透明的,但是如果提供的服务是有状态的,导致状态丢失,比如 youtube ...
    文章 2017-03-23 6459浏览量
  • 说说云计算时代,运维人员踩到哪些坑?

    企业根据业务分配和释放资源,运维人员不仅需要一个强大的控制系统来控制对网络流量、CPU利用率、进程、内存等等节点,还需要一个资源管理系统来管理这些资源的生命状态,还有权限管理,就像AWS的IAM一样。...
    文章 2017-08-02 1916浏览量
  • Shard Allocation-Elastic Stack 实战手册

    在集群删除索引时,因为集群内分片总数发生了变化,自然的分片在各节点的分配状态也随之发生变化,可能会出现分片的"不平衡"状态。这时默认情况下集群,会自动触发分片的重平衡操作,将分片在各节点间适当的迁移,以...
    文章 2021-05-17 124浏览量
  • 游戏运维编年史:可能是目前最详细游戏运维指南

    在做业务型监控时,运维要求后端开发人员写一个特定账号,在访问现有系统时,完整的走一遍业务流,这样就可以看到需要的业务数字。数据仓库搭建 上图为大掌门数据仓库的结构图,由于数据仓库搭建的话题比较大,...
    文章 2017-05-02 3189浏览量
  • SQL Server 性能调优(内存)

    这个错误和buffer pool 没有什么关系主要是大于8k内存分配的时候出现。解决办法就是使用-g启动参数,修改sql server保留空间。多实例下的内存设置 sql server 如果多实例安装在单个机器上或者一个故障转移能减少...
    文章 2012-03-09 878浏览量
  • 高效运维之员工的四大误区及解决之道

    重大故障出现了、长时间未解决,公司和外部门说,你运维部不行、不专业。这时候,即使能独善其身,又有什么用?彩蛋 实在搞不懂轻重缓急,怎么办?这个好办,问上级呗,千万别自己憋着。领导是干什么的?不就是帮...
    文章 2016-06-09 2956浏览量
  • 阿里云云服务器ECS选型指南

    随着技术的演进,神龙架构的神龙卡也是在不断地迭代和改善,搭载了第三代的神龙卡可以整体提升通用、计算和内存这三种实例规格的性能,所以就会出现一个平衡增强。对于大数据的话,做了计算和存储的分离,...
    文章 2020-11-17 19413浏览量
  • Facebook TSDB论文翻译

    大型互联网服务一般出现故障及时响应和保持高可用性为目标。为了提供正常稳定的服务,通常要每秒从大量系统中监控和分析数以千万计的数据(性能数据和业务数据)。一个特别高效的解决方案是用TSDB对这些数据进行...
    文章 2017-08-18 2327浏览量
  • SQL Server 性能调优(内存)

    这个错误和buffer pool 没有什么关系主要是大于8k内存分配的时候出现。解决办法就是使用-g启动参数,修改sql server保留空间。多实例下的内存设置 sql server 如果多实例安装在单个机器上或者一个故障转移能减少...
    文章 2017-11-15 1274浏览量
1 2 3 4 ... 14 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化