• 关于

    分类操作常见故障

    的搜索结果
  • 在 Ali Kubernetes 系统中,我们这样实践混沌工程

    作者| 阿里云智能事业群高级测试开发工程师 智妍 在传统的软件测试中,我们通常通过一个给定的条件来判断系统的反馈,通过断言来判断是否符合预期,测试条件和结果通常比较明确和固定。而混沌工程,是通过注入一些“不确定”因素,象放进了一群淘气的猴子,在系统资源、可用性、安全性、延迟、压力等方面进行捣乱,而...

    文章 jessie筱姜 2019-03-13 2642浏览量

  • 如何运用结构化思维进行故障处理

    近期收到朋友赠送的一本书—《深入浅出MySQL》。闲暇之余,阅读了部分章节,书中针对故障处理一节,给我印象颇深。书中提炼出的一些方法论,正是我之前在团队中推广的方法。其目的是为了将故障应急操作标准化,进而提升处理效率。推而广之,这其实是一种结构化思维在具体工作中的体现。而这种思想在某具体工作、乃至...

    文章 宜信技术学院 2019-10-15 5049浏览量

  • 阿里如何做到百万量级硬件故障自愈?

    随着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务之前实现硬件故障自动闭环策略,对于常见的硬件故障无需人工干预...

    文章 隐林 2018-11-24 3335浏览量

  • 阿里如何做到百万量级硬件故障自愈?

    随着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务之前实现硬件故障自动闭环策略,对于常见的硬件故障无需人工干预...

    文章 技术小能手 2018-11-19 2713浏览量

  • Docker常见故障排查指南 - 阿里云容器服务

    对于Docker的初学者而言,当容器或应用出现了问题不知从何入手进行排查。为此,我们准备了一个简单指南来帮助阿里云容器服务的用户进行故障排查。 由于阿里云容器服务完全兼容Docker Swarm,并支持使用原生Docker Client/API,所以很多内容对于 Docker/Docker Swa...

    文章 易立 2016-08-15 48474浏览量

  • 2.0 解析系列 | OceanBase 2.0 之 Flashback功能

    OB君:本文是 “OceanBase 2.0 技术解析系列” 的第六篇文章。今天我们来聊聊数据的持续可用,说说2.0中大家都很关心的“Flashback”闪回功能。更多精彩欢迎关注OceanBase公众号持续订阅本系列内容! 前言 数据库产品作为信息系统的重要组成部分,除了要高效的处理用户请求,...

    文章 荔子liqi 2018-11-02 1811浏览量

  • 如何用好PostgreSQL的备份与恢复?

    如何用好PostgreSQL的备份与恢复? 作者 赵成 日期 2017-10-22 标签 PostgreSQL , 数据库高可用 , 备份与恢复 高可用性是数据库的关键指标,简单说就是要做到故障时间短,数据不丢失,能够回退到指定位置(时间/事务)。实现高可用的基础是数据库的备份与恢复技术。 Po...

    文章 chengxiaozc 2017-10-22 7374浏览量

  • 《日志管理与分析权威指南》一3.3 日志来源分类

    本节书摘来华章计算机《日志管理与分析权威指南》一书中的第3章 ,第3.3节,(美) Anton A. Chuvakin Kevin J. Schmidt Christopher Phillips 著 姚 军 简于涵 刘 晖 等译更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.3 日志来...

    文章 华章计算机 2017-07-03 1624浏览量

  • Linux备份策略(第二版)

    备份策略   备份思想 一、系统潜在的威胁 Ø 系统硬件故障  Ø 软件故障  Ø 电源故障  Ø 用户的误操作  Ø 人为破坏  Ø 缓存中的内容没有及时的写入磁盘  Ø 自然灾害   二、备份介质的选择 备份介质:硬盘[比较常见的是通过Linux文件服务器] 磁带[常用] 可移...

    文章 翡青 2014-09-23 665浏览量

  • 超级网管员——网络基础

    前    言 据最新调查资料显示,我国网络管理员职位的缺口在30万以上,并且将随着网络的不断普及而增加。因此,学好网络,就在很大程度上意味着能够找到一份相对来说不错的工作。 本书主要内容 本书的目的在于让读者初步接触计算机网络,了解计算机网络中一些最基本的理论,掌握计算机网络中一些最基...

    文章 技术小牛人 2017-11-15 1132浏览量

  • 重学计算机组成原理(十二) - 异常和中断

    1 概览 完好的程序都满足以下特征 自动运行我们的程序和指令都是一条条顺序执行,不需要通过键盘或者网络给这个程序任何输入 正常运行没有遇到计算溢出之类的程序错误。 不过,现实的软件世界可没有这么简单 程序不仅是简单的执行指令,更多的还需要和外部的输入输出打交道 程序在执行过程中,还会遇到各种...

    文章 javaedge 2019-10-21 666浏览量

  • 网络基础前言

    但凡稍具规模的办公场所就会有计算机,但凡有计算机的地方就会有网络,但凡有网络的地方就会有网络应用,但凡是网络应用就会有网络管理员的需求。事实上,据最新调查资料显示,我国网络管理员职位的缺口在30万以上,并且将随着网络的不断普及而增加。因此,学好网络,就在很大程度上意味着能够找到一份好的工作。况且网...

    文章 技术小牛人 2017-11-07 897浏览量

  • 玩转ECS第3讲 | ECS自助服务之智能诊断和自动化修复

    演讲嘉宾简介:滕圣波(云普),阿里云高级技术专家,2018年5月加入阿里云,作为架构师搭建了ECS的事件体系,同时也是阿里云的官方自动化运维平台-运维编排服务的主架构师之一,目前负责ECS智能自治服务、云桌面等领域。在加入阿里云之前,是VMware中国研发中心终端用户计算部门的架构师,拥有北京邮电...

    文章 阿里云弹性计算 2020-10-28 1563浏览量

  • OSS服务监控、诊断和故障排除

    相对于传统的软件运行环境,云数据分布式托管环境虽然解决了很多应用业务在基础设施搭建、运维管理等方面的问题和成本困难,使得应用服务搭建的门槛降低,但是其复杂的云环境,也大大增加了对其监控、诊断和故障排查的难度。 若要成功管理运行在云环境中应用程序,需要主动监视其行为,并熟悉如何诊断和排查自己的应用程...

    文章 婷宝要你疼 2016-05-19 29371浏览量

  • 数据库必知词汇:Mahout

    Mahout 是 Apache基金会旗下的一个开源项目,其提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。Mahout包含许多实现,包括聚类、分类、推荐过滤、频繁子项挖掘。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中...

    文章 萌萌怪兽 2020-02-23 91浏览量

  • 阿里:千亿交易背后的0故障发布

    前言 近几年,我们在发布效率和稳定性方面做了不少工作,其中效率简单的说就是发布耗时,一个是发布的速度,比如一个应用是1个小时发布完成,还是5分钟发布完成?另一个是人员介入,开发在发布过程中是否需要介入处理各种发布过程中出现的问题?这两者都做好了,才能说是发布效率提升了。稳定性最基础的是系统的稳定性...

    文章 阿里云头条 2018-04-20 5000浏览量

  • 无人值守时代,运维如何保障发布质量?

    导读:阿里巴巴千亿交易背后,如何尽量避免发布故障?在面对实际运维过程中遇到的问题该如何解决?近日,在GOPS大会上,阿里巴巴运维技术专家少荃,给我们带来了解决方案和思路。 作者:陆叶平(花名少荃),阿里巴巴研发效能事业部技术专家。目前从事运维中台(阿里内部叫诺曼底)建设方面的工作,是集...

    文章 云效平台 2018-04-18 3359浏览量

  • 一个专业网管的工作笔记(超级珍藏)

    第1章 故障处理方法  一、网络的复杂性  一般网络包括路由、拨号、交换、视频、WAN(ISDN、帧中继、ATM、…)、LAN、VLAN、…  二、故障处理模型  1、 界定问题(Define the Problem)  详细而精确地描述故障的症状和潜在的原因  2、 收集详细信息(Gather ...

    文章 技术小甜 2017-11-07 1010浏览量

  • 《分布式系统:概念与设计》一1.5 挑战

    1.5 挑战 1.2节的例子试图说明分布式系统的范围,并提出在设计中出现的问题。在许多系统中,遇到了重大的挑战并且已经得到解决。随着分布式系统的应用范围和规模的扩展,可能会遇到相同的和其他的挑战。本节我们描述主要的挑战。 1.5.1 异构性 互联网使得用户能在大量异构计算机和网络上访问服务和运行应...

    文章 华章计算机 2017-08-01 1039浏览量

  • 故障排除提示:5 个最常见的 Linux 问题

    尽管绝大多数用户如预期地成功安装和操作了 Linux, 但不可避免地仍会有一些用户遇到问题。作为今年任务队列里的最后一篇文章,我认为在即将进入 2016 年时,总结一下人们所遇到的最常见的技术性的 Linux 问题会很有趣。我把这个问题发布到了 LinuxQuestions.org(LQ) 和社交...

    文章 玄学酱 2017-08-15 741浏览量

  • 突破Windows系统默认用户句柄与GDI句柄限制

    如今,内存越来越便宜,许多朋友为自己的PC配备了高容量的内存,以期得到理想的系统性能,1G、2G甚至更多内存的PC已经很常见了。但是,出乎许多朋友意料的是,即使Windows系统,不仅仅Windows Vista也包括Windows 2000/XP/2003,具有2GB甚至更多的内存,有时也会遇到...

    文章 老先生二号 2017-05-28 1020浏览量

  • 业务应用系统运维服务

    为客户的大型、专业的业务系统提供专业运维服务,客户将其业务系统运维工作全部或者部分交给广东励康来完成,广东励康派驻专业工程师在客户现场来完成运维工作,提高客户业务系统平台的整体运行质量和运维水平。业务范围包括大型企业、国家机关等大型业务管理软件系统。 一.服务内容 1.系统运行环境维护 对客户各类...

    文章 游客sllnrmar4gnky 2019-04-02 1427浏览量

  • elasticsearch 文档

    elasticsearch 文档 文档格式 索引中最基本的单元叫做文档 document. 在es中文档的示例如下: { "_index": "questions", "_type": "baichebao", "_id": "4", "_score": 1, ...

    文章 轩脉刃 2016-05-17 1511浏览量

  • Memcache 分布式高可用集群介绍

    分布式缓存需考虑如下三点: 1、缓存本身的水平线性扩展的问题。 2、缓存大病罚下的本身性能问题。 3、避免缓存的单点鼓掌问题。 分布式缓存存在的问题: 1、内存本身的管理问题。内存的分配,管理和回收机制。 2、分布式管理和分布式算法。 3、缓存键值管理和路由。 常见分布式算法         ...

    文章 科技小毛 2017-10-13 1152浏览量

  • elasticsearch 文档

    elasticsearch 文档 文档格式 索引中最基本的单元叫做文档 document. 在es中文档的示例如下: { "_index": "questions", "_type": "baichebao", "_id": "4", "_score": 1, ...

    文章 技术mix呢 2018-01-07 990浏览量

  • 《Oracle数据库性能优化方法论和最佳实践》——1.4 Oracle性能优化工作的分类

    本节书摘来自华章计算机《Oracle数据库性能优化方法论和最佳实践》一书中的第1章,第1.4节,作者:柳遵梁 潘敏君 应以峰著,更多章节内容可以访问云栖社区“华章计算机”公众号查看 1.4 Oracle性能优化工作的分类 在Oracle上进行性能优化时,不同场景下的优化工作方法和内容有很大的不同。...

    文章 华章计算机 2017-05-02 1523浏览量

  • 分布式系统数据层设计模式

    原创声明:本文系作者原创,谢绝个人、媒体、公众号或网站未经授权转载,违者追究其法律责任。 2013 年 5 月,支付宝最后一台小型机下线,去 “IOE” 取得里程碑进展。支付宝(以及后来的蚂蚁金服)走的是一条跟传统金融行业不同的分布式架构之路。要基于普通硬件资源实现金融级的性能和可靠性,有不少难...

    文章 初商 2019-08-03 643浏览量

  • 云上数据库容灾解决方案

    容灾的定义 容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境...

    文章 杨重 2018-10-15 1419浏览量

  • 云上数据库容灾解决方案

    容灾的定义 容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对...

    文章 耿纯 2018-02-24 12867浏览量

  • 云服务器 ECS 监控:监控ECS实例

    监控ECS实例 一般来说,在本地数据中心我们会对基础设施进行监控,其中包括对主机实例的监控,以便系统地和随时地了解资源使用情况和性能变化,在出现性能瓶颈的时候合理地调配资源,或者在发生故障时追溯原因等等。 在阿里云上,ECS实例也承载着我们的业务应用,ECS实例的资源使用情况和性能负载直接影响着...

    文章 琴瑟 2017-08-14 4543浏览量

1 2 3 4 ... 8 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT