• 【云吞铺子】性能抖动剖析(一)

    首期我们将聚焦系统类常见问题——性能抖动,阿里云高级技术专家江冉将分享多年故障排查心得体会与经典案例实战经验。完成学习,你就是明日技术大牛!网络抖动案例是一类处理难度较大的问题,原因主要是很多抖动发生...
    文章 2019-04-17 2260浏览量
  • 状态快照转移:一种MySQL Galera集群较优的备份方法

    receiver接收并应用transfer完成之后,会输出接受节点的标准GTID,退出脚本,返回状态0,说明状态转移成功。sender在完成传输后,会发送一个done的信号,当脚本收到这个信号之后,会返回0值退出。通过状态快照转移...
    文章 2017-05-02 2665浏览量
  • Nginx负载均衡配置+keepalived高可用

    观察从节点是否可以生成VIP主节点:从节点:⑨主节点启动keepalived服务后,观察是否出现“脑裂现象”主节点:从节点:访问tomcat页面不受任何影响,说明故障移除是OK的10.因为我们是用nginx做负载均衡分发请求数据...
    文章 2018-11-16 2673浏览量
  • CentOS6.4 配置DNS服务器

    常见的正解文件 RR 相关信息 [domain]IN[[RR type][RR data]] 主机名.IN A IPv4 的 IP 地址 主机名.IN AAAA IPv6 的 IP 地址 领域名.IN NS 管理这个领域名的服务器主机名字. 领域名.IN SOA 管理这个领域名的七个重要...
    文章 2013-08-23 1021浏览量
  • Rainbond集群安装和运维原理解读

    Rainbond安装脚本对Etcd,Rbd-monitor做了较好的自动安装支持,对于Mysql数据库,我们更建议用户独立安装Mysql数据库并提供给Rainbond安装脚本。管理节点其他的组件基本上可以认为是无状态的,或有状态的组件都自身...
    文章 2019-07-26 1268浏览量
  • 【Redis高手修炼之路】①Redis是什么

    网站常见功能:记录帖子的阅读量限制服务的访问次数记录用户的兴趣标签记录帖子的点赞数量记录用户的粉丝数量计算用户的共同关注记录用户的待办事项生成热门帖子排行榜搜索功能的自动补全存储用户的登录会话网站后台...
    文章 2022-07-10 10浏览量
  • 阿里如何做到百万量级硬件故障自愈?

    但读写问题却不一定是媒介故障产生,所以我们有必要说明一下媒介故障的在各层的表象。a.系统日志报错是指在/var/log/messages中能够找到类似下面这样的报错 Sep 3 13:43:22 host1.a1 kernel:[14809594.557970]sd 6:0...
    文章 2018-11-24 3659浏览量
  • 我眼中的自动化测试框架设计要点

    脚本执行的时候,框架应当能够实时监控脚本的运行情况,如果碰到运行故障的时候应当能进行基本的容错恢复处理,这样的话不至于使脚本处在一个被block的状态,从而浪费大量时间。测试报告 不同的应用程序往往会有...
    文章 2017-07-03 1491浏览量
  • 阿里如何做到百万量级硬件故障自愈?

    但读写问题却不一定是媒介故障产生,所以我们有必要说明一下媒介故障的在各层的表象。a.系统日志报错是指在/var/log/messages中能够找到类似下面这样的报错 Sep 3 13:43:22 host1.a1 kernel:[14809594.557970]sd 6:0...
    文章 2018-11-19 3291浏览量
  • Oracle 白皮书-Oracle Data Guard 快速启动故障切换...

    常见的问题是不匹配 Data Guard 保护模式和 LogXptMode 属性,以及忘记在主数据库或备用数据库上启用闪回数据库。注意,启用 FSFO 并不能使其完成自动故障切换的配置—这需要我们接下来将介绍的观察器。enable ...
    文章 2017-11-15 1112浏览量
  • Heartbeat(v1、v2、pacemaker)集群组件概述

    官方说明:有共享存储时,每个节点可能被用于故障转移。Pacemaker甚至可以运行多个服务。4.共享存储热备(Split Site) 官方说明:Pacemaker 1.2 将包括增强简化设立分站点集群 五、Pacemaker内部结构 群集组件说明...
    文章 2017-11-04 1213浏览量
  • 如何运用结构化思维进行故障处理

    图中的【】部分对应具体的处理步骤(对应脚本或操作文档)。从上述两个示例可以看出,这是一种"统筹式"的工作方式,而非"应急式"的。它强调的是在出现故障后,按照规划好的原则、步骤进行分析排查,找出核心问题;...
    文章 2019-10-15 5478浏览量
  • Linux下双机HA的功能实现(理论)

    集群变动事务(transition)信息:ip-request和ip-request-rest是相对较常见的两种集群变动信息,它们在节点间需要进行资源迁移时为不同节点上heartbeat进程间会话传递信息。比如,当修复了主节点并且使其重新“上线...
    文章 2017-11-22 1094浏览量
  • 一探究竟:善用 MaxCompute Studio 分析 SQL 作业

    MaxCompute 用户一个常见的问题是:同一个周期任务,为什么最近几天比之前慢了很多?或者为什么之前都能按时产出的作业最近经常破线?通常来说,引起作业执行变慢的原因有:quota 组资源不足、输入数据量变动、数据...
    文章 2018-05-17 1548浏览量
  • keepalived实现服务高可用

    etc/rc.d/init.d/keepalived#服务启动脚本 etc/sysconfig/keepalived usr/bin/genhash usr/libexec/keepalived usr/sbin/keepalived 第二个里程碑:进行默认配置测试 2.1.2 配置文件说明 1-13行表示全局配置 global_...
    文章 2017-12-17 2407浏览量
  • 把前端监控做到极致

    前端发生故障常见的原因就是新发布的版本存在 Bug,那么这种问题在监控平台中如何提供分析思路呢?当然,也并不是所有的波动都是前端变更引起。比如说后端接口突然故障,也会导致前端因为无法读取到某个接口结果而...
    文章 2018-07-11 2443浏览量
  • windows power shell

    为了帮助你了解管道是如何工作的,我们以一个例子进行说明,假设你想创建运行在服务器上的进程列表,并按进程的ID号进行排序,可以使用Get-Process cmdlet命令获得进程列表,但默认情况下列表不会排序,如果将这个...
    文章 2012-08-22 1188浏览量
  • 高可用集群原理概念详述

    通过集群管理和监控工具以及预定义的脚本来配置常见的服务或应用程序,监控,故障转移等。最为大家所熟知的如心跳,主要用于在集群环境中各节点之间相互感知对方的存在。可以基于串口、多播、广播和组播通信机制。...
    文章 2017-11-09 1196浏览量
  • dd

    通过集群管理和监控工具以及预定义的脚本来配置常见的服务或应用程序,监控,故障转移等。最为大家所熟知的如心跳,主要用于在集群环境中各节点之间相互感知对方的存在。可以基于串口、多播、广播和组播通信机制。...
    文章 2017-11-14 1295浏览量
  • 红包雨中:Redis 和 Lua 的邂逅

    5.2 EVAL 命令命令格式:EVAL script numkeys key[key.]arg[arg.]说明:script是第一个参数,为 Lua 5.1脚本;第二个参数numkeys指定后续参数有几个 key;key[key.],是要操作的键,可以指定多个,在 Lua 脚本中通过...
    文章 2022-06-19 36浏览量
  • 本人新书-Redis开发与运维-目录

    4.5 客户端常见异常 4.5.1 无法从连接池获取到连接 4.5.2 客户端读写超时 4.5.3 客户端连接超时 4.5.4 客户端缓冲区异常 4.5.5 Lua脚本正在执行 4.5.6 Redis正在加载持久化文件 4.5.7 Redis使用的内存超过maxmemory...
    文章 2016-10-25 1775浏览量
  • 如何编写服务器文档记录

    众所周知,命令行脚本是缺乏注释的,所以,添加注释能够在未来更容易的进行修改或故障排除。然后,部署一个版本控制系统,以帮助管理员跟踪每一个版本,并理解当一款系统何时可能在使用旧的或错误的脚本。以文档明确...
    文章 2017-07-03 1185浏览量
  • MySQL 高可用性—keepalived+mysql双主(有详细步骤和...

    从上图可以说明在master服务器的mysql服务发生故障时,mysql1主机触发了我们编写的脚本,发生了自动故障切换。11、现在我们把mysql1的mysql服务开起来,并且keepalived的服务也需要手动开启 12、我们再次在两台mysql...
    文章 2017-11-14 1422浏览量
  • Linux中的日志分析及管理

    对于Linux系统中的一些常见日志文件,有必要熟悉其相应的用途,这样才能在需要的时候更快地找到问题所在,及时解决各种故障常见的日志文件如下: var/log/messages:记录Linux内核消息及各种应用程序的公共日志...
    文章 2017-11-14 1264浏览量
  • MySQL:由USE DB堵塞故障引发的思考

    遇到故障,我们往往想的是如何解决这个故障,而不是从故障的根本去思考出现这个故障的原因?这样的结果,只能使我们得到了鱼,失去了渔。今天,我们就来分享一个由USE DB堵塞故障引发的思考案例。故障描述今天一个...
    文章 2017-12-22 3081浏览量
  • 【Linux】定时任务-crontab

    1.4.3 常见故障及解决方法一、日期错误 crontab编辑后报错 crontab:installing new crontab"/tmp/crontab.QZzQuN":1:bad minute报错原因:crontab –e只写了命令,日期出现错误或者未填写 解决方法:crontab –e重新...
    文章 2019-09-02 3155浏览量
  • 一文读懂测试自动化

    图片一个常见的敏捷测试自动化金字塔以测试驱动的开发单元测试的形式说明了这一概念,其中一小部分代码被重复测试,有时一天几次。相反,需要高度主观意见或标准的测试,并且不能轻易编纂,可能不适合自动化。此处的...
    文章 2022-03-02 43浏览量
  • zabbix 实战部署

    众多网络工具都支持此协议,比如常见路由交换,常见OS 其既可以做管理端也可以做被管理端 snmp协议大致有3个版本分别是v1 v2 v3 无论是v1 和 v2 的安全性是比较差的,因为传输是明文的,V3的认证密码用MD5/SHA摘要...
    文章 1970-01-01 3636浏览量
  • zabbix 实战部署

    众多网络工具都支持此协议,比如常见路由交换,常见OS 其既可以做管理端也可以做被管理端 snmp协议大致有3个版本分别是v1 v2 v3 无论是v1 和 v2 的安全性是比较差的,因为传输是明文的,V3的认证密码用MD5/SHA摘要...
    文章 1970-01-01 1151浏览量
  • Nginx+Keepalived实现站点高可用

    公司内部 OA 系统要做线上高可用,避免单点故障,所以计划使用2台虚拟机通过 Keepalived 工具来实现 nginx 的高可用(High Avaiability),达到一台nginx入口服务器宕机,另一台备机自动接管服务的效果。(nginx做...
    文章 2017-05-02 1606浏览量
1 2 3 4 ... 21 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化