• 关于

    类图发生故障怎么办

    的搜索结果
  • 对系统故障处理的思考

        年初去某公司面试时,对方的项目经理问如果数据库现在很慢,你该怎么办,我问慢的现象是什么,数据库是被调用的不会莫名其妙就慢了,对方说什么都没有,就是慢了,你该怎么办?我说既然是这样,那就按老办法处理了:1. 登陆机器用topas 、svmon -G、sar 1 100、ps aux 等,查看...

    文章 余二五 2017-11-14 873浏览量

  • 没有服务台,就没有ITSM

    告别混乱从服务台开始 ITSM的理念在业界已经流传了很多年了,但是能真正将ITSM实施成功并坚持使用的却是不多,常常有用户抱怨说用了很多个ITSM管理软件,但是却发现比以前更加繁琐了,没有ITSM的时候,当财务部的打印机出现问题了,只需要给运维部的小张打个电话,小张就一溜小跑到财务室,花费几...

    文章 技术小美 2017-11-12 1054浏览量

  • 块存储支持云化618实战总结

    集团云化项目事实上是整个阿里巴巴在基础技术和中间件技术,以及上层应用的一个技术的巨大的团建。他像当年做双11一样的重要。而在这个过程中间,整个阿里巴巴生态体技术体系如何思考重构,甚至分工重新的发生,都有可能。 ——老石头 本文作者:虎芽,阿里云智能 技术专家 背景 从最早的 2015 年支持大数据...

    文章 公开课小能手 2019-10-09 786浏览量

  • 走近华佗,解析自动化故障处理系统背后的秘密

    集群医生华佗是集群自动化故障监测和处理系统,是平台和运维对接的关键系统。一方面完成飞天其他组件不擅长的OS和硬件的故障自动监测和处理,另一方面推动飞天去及时规避硬件和OS引起的故障,使得故障能够闭环运转,大幅度减少故障处理成本和造成的影响。飞天5K项目期间的规模效应凸显出自动化处理故障的必要性,大...

    文章 yq传送门 2016-12-18 4475浏览量

  • 《构建高可用Linux服务器 第3版》—— 2.2 安装系统时容易发生的错误描述与处理方法

    本节书摘来自华章出版社《构建高可用Linux服务器 第3版》一 书中的第2章,第2.2节,作者:余洪春 ,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.2 安装系统时容易发生的错误描述与处理方法 如果购买了新服务器,我们最先做的事情肯定是检测硬件和安装服务器系统,不过,在安装过程或调...

    文章 华章计算机 2017-07-03 1196浏览量

  • 互联网企业安全高级指南3.11 业务持续性管理

    3.11 业务持续性管理 业务持续性管理(BCM)是一个较高层次的管理机制,通常对应到公司层面,它使企业认识到潜在的危机和相关影响,制订响应、业务和连续性的恢复计划,其总体目标在于提高企业的风险防范能力,有效地响应非计划的业务破坏并降低不良影响。以2015年中国互联网行业的标志性事件为例,网易、...

    文章 华章计算机 2017-05-15 1305浏览量

  • 都在说微服务,那么微服务的反模式和陷阱是什么(一)

    网上看到一本关于微服务反模式的电子书,看后感觉内容非常棒,于是我决定分阶段翻译成中文书,翻译的目的也是想帮助想深入了解微服务的朋友,由于英文水平有限,如有翻译不对之处希望多留言指正。 书籍英文目录如下 书籍中文目录如下: 1、数据驱动的迁移反模式 1.1、太多的数据迁移 1.2、功能分割优先,数...

    文章 技术小能手 2018-01-09 1678浏览量

  • 大众点评工程师:从黄金圈法则看MySQL数据库复制

    每当我们讨论一项(新的)领域技术的时候,最好的方式通常是首先抛出一些问题,这些问题大致分为三类:  诶?这项技术又是什么玩意(What)? 这项技术为什么会存在?我们已经有那么多解决方案(Method)了,我们问什么要用它(Why)? 如果这项技术那么好且我们正好有场景可以用到这项技术...

    文章 努力酱 2017-05-02 1319浏览量

  • Apache Flink 在快手的过去、现在和未来

    本文由快手大数据架构团队负责人赵健博分享,主要介绍 Apache Flink 在快手的过去、现在和未来。内容包括:为什么选 FlinkFlink 在快手的发展业务数据流技术创新未来计划一、为什么选 Flink大家好,我是赵健博,来自快手,目前负责快手大数据架构团队。今天很高兴可以和大家分享我们在 ...

    文章 阿里云实时计算Flink 2021-02-26 852浏览量

  • Windows2003配置集群详解

    原文: http://blog.csdn.net/xunyn/article/details/7388900    集群是在一组计算机上运行相同的软件并虚拟成一台主机系统为客户端与应用提供服务;计算机通过缆线物理连接并通过集群软件实现程序上的连接,可以使计算机实现单机无法实现的容错和负载均衡。集群...

    文章 孤剑 2015-12-09 568浏览量

  • DTCC 2019 | 深度解码阿里数据库实现 数据库内核——基于HLC的分布式事务实现深度剖析

    摘要: 分布式事务是分布式数据库最难攻克的技术之一,分布式事务为分布式数据库提供一致性数据访问的支持,保证全局读写原子性和隔离性,提供一体化分布式数据库的用户体验。本文主要分享分布式数据库中的时钟解决方案及分布式事务管理技术方案。混合逻辑时钟(HLC)可以实现本地获取,避免了中心时钟的性能瓶颈和单...

    文章 七幕 2019-05-24 6876浏览量

  • 打造应用全栈监控:ARMS 最佳实践

    ARMS作为业务的实时监控系统,可以帮助用户定位从前端到应用的普遍问题,以及利用全系排查解决单点问题定位。本文利用案例演示,更直观的为大家介绍ARMS是怎么帮助用户快速的定界和定位的。让天下没有难定位的问题是ARMS的最终愿景。 演讲嘉宾简介: 徐彤,阿里巴巴中间件技术家 阳其凯,阿里巴巴中间...

    文章 mongolguier 2018-05-31 1781浏览量

  • 字节跳动 Flink 单点恢复功能实践

    背景 在字节跳动的实时计算场景中,我们有很多任务(数量 2k+)会直接服务于线上,其输出时延和稳定性会直接影响线上产品的用户体验,这类任务通常具有如下特点: 流量大,并发高(最大的任务并行度超过 1w) 拓扑类似于多流 Join,将各个数据源做整合输出给下游,不依赖 Checkpoint 没有使...

    文章 阿里云实时计算Flink 2020-09-29 5530浏览量

  • 论程序的健壮性——就看Redis

    “众里寻他千百度,蓦然回首,那人却在,灯火阑珊处”。多年的IT生涯,一直希望自己写的程序能够有很强的健壮性,也一直希望能找到一个高可用的标杆程序去借鉴学习,不畏惧内存溢出、磁盘满了、断网、断电、机器重启等等情况。但意想不到的是,这个标杆程序竟然就是从一开始就在使用的分布式缓存——Redis。 Re...

    文章 宜信技术学院 2020-09-16 506浏览量

  • 如何做好一名稳定性SRE--业务团队系统稳定性的思与行

    前言 2013年,当我第一次接触稳定性的时候,我是有些懵的,当时完全不知道稳定性是什么,也不清楚要做什么。在接下来的8年里,我先后在菜鸟、天猫、盒马从事中间件、业务系统、架构等方面的工作,期间一直穿插着负责稳定性和大促的保障工作。我的心态,大致经历过以下几个阶段: low:完全不懂,觉得稳定性就...

    文章 茶什i 2020-10-26 2230浏览量

  • 高效运维之员工的四大误区及解决之道

    这篇是《中生代》转载的一个关于运维的文章。作者是触控科技运维总监萧田国。文章在运维圈子流传甚广。特别也发在社区,分享给感兴趣的朋友。 前言 春节刚过,广大运维朋友又面临着新的挑战。让大家苦恼的是,我能力这么好,为什么不幸福?怎么能让工作不那么累心,怎么能多些成就感?甚至,还有机会幸福吗? 通常,...

    文章 jurassic_1 2016-06-09 2811浏览量

  • 疫情期,APP 崩了怎么办?阿里工程师公开高可用架构笔记

    阿里巴巴在多年 双11 高并发,高可用和高客户体验要求背景下积累了相应的技术体系,并赋能罗辑思维等客户,帮助他们落地全链路压测。本文整理自高用户、突发高流量场景下的真实案例,公布阿里在高可用架构建设过程中的实践笔记,期待帮助更多企业从容应对接下来的高流量场景。 你的应用为什么崩了? 非常复杂的服务...

    文章 檸,铮 2020-02-18 4622浏览量

  • 车联网上云最佳实践(二)

    第一篇内容:《车联网上云最佳实践(一)》 二、传统IDC架构介绍及技术详解 俗话说知己知彼百战不殆,我们要上云首先要充分了解自己业务和应用架构。然后在充分了解云上产品的特性,看看哪些产品可以直接被我们使用,哪些是需要我们的应用或架构做出调整的。下面我们来分析下智能车联网平台的相关架构。   1、...

    文章 zkw9527 2018-08-22 2490浏览量

  • 命令行下Apache日志统计举例

    Apache日志统计举例 加些来了解一下如何统计Apache的访问日志,一般可以用tail命令来实时查看日志文件变化,但是各种的应用系统中的日志会非常复杂,一堆长度超过你浏览极限的日志出现在你眼前时,你会觉得非常无奈,怎么办呢?这时可以用grep、sed、awk和sort等筛选工具帮助你解决这个...

    文章 技术小胖子 2017-11-16 944浏览量

  • 如何基于OceanBase构建应用和数据库的异地多活

    如何基于OceanBase构建应用和数据库的异地多活 前言 OceanBase是一个通用的分布式的关系型数据库,有很多独特的特点。比如数据库的多租户、高可用、极致弹性伸缩能力。如果把OceanBase当作单库使用,就没有把OceanBase的分布式优势发挥到极致。 本文主要分享一个基于分布式...

    文章 mq4096 2019-01-02 3924浏览量

  • 信息系统项目管理01——信息化和信息系统

    第一章 信息化和信息系统 考选择,非常重要 @[toc] 1.1 信息系统与信息化 1 信息的质量属性(第3页) (1)精确性,对事物状态描述的准确性(2)完整性,对事物状态描述的全面程度,完整信息包括所有重要事实(3)可靠性,信息的来源、采集方法、传输过程是可以信任的,符合预期(4)及时性,获...

    文章 阿墨呦 2020-12-11 81浏览量

  • 一个复杂系统的拆分改造实践

    1 为什么要拆分? 先看一段对话。 从上面对话可以看出拆分的理由: 1)  应用间耦合严重。系统内各个应用之间不通,同样一个功能在各个应用中都有实现,后果就是改一处功能,需要同时改系统中的所有应用。这种情况多存在于历史较长的系统,因各种原因,系统内的各个应用都形成了自己的业务小闭环; 2)  业...

    文章 力君 2017-01-04 7457浏览量

  • Spring Cloud 微服务的那点事

    在详细的了解SpringCloud中所使用的各个组件之前,我们先了解下微服务框架的前世今生。 单体架构 在网站开发的前期,项目面临的流量相对较少,单一应用可以实现我们所需要的功能,从而减少开发、部署和维护的难度。这种用于简单的增删改查的数据访问框架(ORM)十分的重要。 垂直应用架构 ...

    文章 java填坑路 2018-09-25 923浏览量

  • “SDN分析”是开启未来智能网络大门的钥匙

    SDN通常被网络专业人士描述为将控制平台和数据平台分离开来,虽然这在技术上没错,不过这种描述并未凸显出SDN的实际效益。对于SDN来说,还有一种更有意思也更有价值的说法是网络定义、架构、实施以及运作策略的整合。这样一来,如果网络确实是组织的循环系统,SDN可以让其更智能、灵活且适应性更强。SDN分...

    文章 青衫无名 2017-07-03 835浏览量

  • “SDN分析”是开启未来智能网络大门的钥匙

    SDN通常被网络专业人士描述为将控制平台和数据平台分离开来,虽然这在技术上没错,不过这种描述并未凸显出SDN的实际效益。对于SDN来说,还有一种更有意思也更有价值的说法是网络定义、架构、实施以及运作策略的整合。这样一来,如果网络确实是组织的循环系统,SDN可以让其更智能、灵活且适应性更强。SDN分...

    文章 青衫无名 2017-08-01 695浏览量

  • 命令行下Apache日志统计举例

    原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://chenguang.blog.51cto.com/350944/1414820 Apache日志统计举例 加些来了解一下如何统计Apache的访问日志,一般可以用tail命令...

    文章 shy丶gril 2016-05-25 1474浏览量

  • 运维前线:一线运维专家的运维方法、技巧与实践1.4 运维自动化的多维解读

    1.4 运维自动化的多维解读 1.4.1 基于应用变更场景的维度划分 我们曾经探讨过,所有运维的价值导向最终都是面向业务、面向用户,所以自然而然就需要从业务的维度进行划分。而运维是有很多种场景的,但从业务的角度来说,核心的业务场景一般就包括如下5种:业务上线、业务下线、业务扩容、业务缩容和应用升...

    文章 华章计算机 2017-05-02 2309浏览量

  • 阿里如何做好双11技术保障?大队长霜波分享4点经验

    每年双11都是一个比较艰难的项目。我现在的职位是阿里集团的技术风险负责人,所谓技术风险就是稳定性的保障是我这边负责的。对阿里巴巴来说,对整个经济体来说,每年技术风险最大的一次就是双11。 为什么说双11是每年技术保障稳定性最困难的一次?每年双11我们都会向大家分享交易额是多少,连续12年的数字大...

    文章 开发者小助手 2021-01-06 224浏览量

  • 阿里如何做好双11技术保障?大队长霜波分享4点经验

    作者 | 霜波 左延鹊来源 | 阿里技术公众号每年双11都是一个比较艰难的项目。我现在的职位是阿里集团的技术风险负责人,所谓技术风险就是稳定性的保障是我这边负责的。对阿里巴巴来说,对整个经济体来说,每年技术风险最大的一次就是双11。 为什么说双11是每年技术保障稳定性最困难的一次?每年双11我们都...

    文章 开发者小助手_LS 2021-01-06 2312浏览量

  • Elasticsearch 全观测技术解析与应用(四):ES全观测性行业应用

    点击免费下载《Elasticsearch 全观测技术解析与应用》>>> 分享人:李猛一、什么是全观测性 全观测性简单讲就是“监控”、“一体化的监控”。它包括几个方面:一方面叫日志数据,就是文本,第二方面包括一些指标数据,第三方面就是这套产品必须有告警通知。 日志数据 工作开发中...

    文章 开发者小助手 2020-12-17 496浏览量

1 2 3 4 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT