• 关于

    进程环境设备故障原因

    的搜索结果
  • Linux之软件包类故障排错

    软件包类故障在Linux系统中比较常见,例如:需要编译源码包程序时系统中没有安装gcc编译工具,安装RPM软件包时有未解决的依赖关系,程序库文件或头文件的安装路径不正确等,软件包类故障产生的原因非常多,通常只需要根据相应的错误提示信息,确认安装好编译环境,找到所需要的依赖软件包,纠正库文件或对应的...

    文章 科技小能手 2017-11-15 1114浏览量

  • 带你读《智能制造之卓越设备管理与运维实践》之三:运维资源信息化管理

    点击查看第一章点击查看第二章 第3章 运维资源信息化管理要实现高效运维,首先要实现资源的高效管理。借助信息化手段,可以将运维资源中的技术、员工、备件、数据进行有效整合,为高效运维奠定良好的基础。本章的结构如图3-1所示。 3.1 管理需求 基于精益管理思想,工厂在生产管理过程中,会通过各种方式来...

    文章 温柔的养猫人 2019-11-08 694浏览量

  • Oracle的三种高可用集群方案

    转载自:http://www.cnblogs.com/baiboy/p/orc2.html#_label1 Oracle的三种高可用集群方案 1 RAC(Real Application Clusters) 多个Oracle服务器组成一个共享的Cache,而这些Oracle服务器共享一个基于网络的...

    文章 流浪的猫666 2018-07-01 3494浏览量

  • 走近华佗,解析自动化故障处理系统背后的秘密

    集群医生华佗是集群自动化故障监测和处理系统,是平台和运维对接的关键系统。一方面完成飞天其他组件不擅长的OS和硬件的故障自动监测和处理,另一方面推动飞天去及时规避硬件和OS引起的故障,使得故障能够闭环运转,大幅度减少故障处理成本和造成的影响。飞天5K项目期间的规模效应凸显出自动化处理故障的必要性,大...

    文章 yq传送门 2016-12-18 4475浏览量

  • 宽带路由器常见故障排除技巧

    宽带路由器常见故障排除技巧带路由器在企业网络中的应用是相当广泛的,在运行的过程中出现故障是在所难免的,虽然故障现象多种多样,引起故障发生的原因也不尽相同,但从大体上可以把这些故障分为硬件故障和软件故障,具体来说就是一些网络连接性问题、配置文件选项问题以及网络协议问题等。  由于路由器发生故障而导致...

    文章 技术小阿哥 2017-11-27 826浏览量

  • AIX的Dump文件学习笔记(原创)

    DUMP文件概述  为了增强故障分析能力,IBM的服务器增加了对设备故障当前环境的保存功能,就是保存一份设备故障时的内存、CPU寄存器、IO等设备的数据和状态信息,如果系统并没有停住,只是某个程序死掉,会产生CORE DUMP,在当前目录下产生一个CORE文件。而如果操作系统死掉,则产生Syste...

    文章 ghost丶桃子 2016-05-24 1993浏览量

  • 服务器故障排查的前五分钟[转]

    我们团队为上一家公司承担运维、优化和扩展工作的时候,我们碰到了各种不同规模的性能很差的系统和基础设备(大型系统居多,比如CNN或者世界银行的系统)。要是再赶上修复时间紧、奇葩的技术平台、缺少信息和文档,基本上这过程都会惨痛到让我们留下深刻的记忆。 遇到服务器故障,问题出现的原因很少可以一下就想到。...

    文章 cnhejia 2016-04-07 1967浏览量

  • 深入探讨运维驱动的可监控性设计

    “外部质量验收驱动技术债务消除”的理念: 技术债务的形成往往是由于赶进度忽略了非功能质量特性而导致的,由于内部质量的不佳(设计或代码质量不高)导致外部质量的低下。 传统IT领域通常有上线前的验收测试,如果能够在验收测试过程中重点关注非功能需求的实现质量,则可以“由外而内”地驱动开发团队在开发过...

    文章 努力酱 2017-05-02 1369浏览量

  • 《Effective Debugging:软件和系统调试的66个有效方法》一导读

    前 言 我们在开发软件或对运行软件的系统进行管理的时候,经常会遇到故障。有些故障是因代码问题而引发的编译错误,这种故障可以在短时间内修复;还有一些故障则会使大型系统停机,这将给公司带来每小时数百万的损失(具体货币单位依情况而定)。要想成为一名优秀的专业人士,你就必须在发生故障时迅速找出背后的原因并...

    文章 华章计算机 2017-05-02 1219浏览量

  • Linux 服务器故障排除的前五分钟 (First 5 Minutes Troubleshooting A Linux Server)

    一、前言 二、简介 三、具体过程 尽可能搞清楚问题的前因后果 有谁在? 之前发生了什么? 现在在运行的进程是啥? 监听的网络服务 CPU和内存使用情况 查看硬件 I/O 性能 挂载点和文件系统 内核、中断和网络 系统日志和内核消息 任务计划 查看...

    文章 技术小美 2017-11-07 1055浏览量

  • 《VMware Virtual SAN权威指南(原书第2版)》一3.9 vSphere HA

    3.9 vSphere HA VSAN群集完全支持vSphere HA,以为群集中部署的虚拟机提供额外的可用性。然而,对于vSphere HA我们做出了很多显著的变化来确保和VSAN之间的良好的互操作性。理解这些变化将如何影响vSphere HA的配置是非常重要的。 3.9.1 vSphere H...

    文章 华章计算机 2017-08-01 1399浏览量

  • 高可用系统常用解决手段浅述

    所谓可用性,是指 某系统能够提供正常服务的特性。 可用性的高低是使用不可用时间占总时间的比例来衡量。不可用时间是从故障发生到故障恢复的时间。 比如,可用性 4 个 9 的系统(99.99%),它一年宕机时间不能超过53分钟(=365*24*60*(1-0.9999)) 。 做到高可用系统,需要尽可...

    文章 知与谁同 2017-05-23 1334浏览量

  • 阿里基础设施的智能监控

    IDC、网络、服务器等基础设施承载了一次又一次的双十一奇迹。随着阿里集团业务全球化、多元化发展,作为整个集团之根本的基础设施,其运营水平显得愈发重要,智能监控成为了重中之重。 阿里IDC承载着为全球业务提供基础服务的重担,服务的稳定性和可用性有着极高的业务要求,同时又面临全球机房环境迥异、设施链条...

    文章 初商 2019-07-30 1014浏览量

  • 一个专业网管的工作笔记(超级珍藏)

    第1章 故障处理方法  一、网络的复杂性  一般网络包括路由、拨号、交换、视频、WAN(ISDN、帧中继、ATM、…)、LAN、VLAN、…  二、故障处理模型  1、 界定问题(Define the Problem)  详细而精确地描述故障的症状和潜在的原因  2、 收集详细信息(Gather ...

    文章 技术小甜 2017-11-07 1006浏览量

  • 第二章、进程的描述与控制

    第二章、进程的描述与控制 2.1 前趋图和程序执行 2.1.1 前趋图 概念: 所谓前趋图:指一个有向无循环图(DAG),它用于描述进程之间执行的先后顺序。 2.1.2 程序顺序执行 特征: 顺序性 封闭性:指程序在封闭的环境中运行,程序运行时独占全机资源,资源的状态只有本程序才能改变,程序一旦...

    文章 我不是掌柜 2016-04-22 1694浏览量

  • 《深入理解计算机系统》读书笔记 & 要点总结<下>

    §第六章 存储器层次结构 在简单模型中,存储器系统是一个线性的字节数组,而CPU能够在一个常数时间内访问每个存储器位置。实际上,存储器系统(memory system)是一个具有不同容量、成本和访问时间的存储器层次结构。CPU寄存器保存着最常用的数据。靠近CPU的小的、快速的高速缓冲存储器(c...

    文章 浅墨 2016-03-31 3147浏览量

  • VMware vSphere常见问题汇总(十二)

    110、尝试使用附加的 USB 设备迁移虚拟机时的错误消息 将多个 USB 设备从 ESXi 主机连接到虚拟机且一个或多个设备未启用 vMotion 功能时,通过 vMotion 进行迁移将无法继续并会发出一条并不十分明确的错误消息。 故障状态: 迁移虚拟机向导会在迁移操作开始之前运行兼容性检查。...

    文章 科技小能手 2017-11-14 1167浏览量

  • 虚拟机存储延迟 究竟是什么原因?

    在虚拟化系统中,存储性能或延迟问题发生在哪里? 由于配置不佳或设备争用,存储性能问题常常出现。虽然听起来简单,实际上这是一个定位存储延迟问题根源的挑战。技术人员可以使用日志和基准来帮助缩小问题范围。在特定的设备日志报告错误,所以先调查最有可能发生的问题,比如存储设备超时或其他错误消息。Hyperv...

    文章 玄学酱 2017-07-05 769浏览量

  • 在大规模 Kubernetes 集群上实现高 SLO 的方法

    作者 | 蚂蚁金服技术专家 姚菁华;蚂蚁金服高级开发工程师 范康 导读:随着 Kubernetes 集群规模和复杂性的增加,集群越来越难以保证高效率、低延迟的交付 pod。本文将分享蚂蚁金服在设计 SLO 架构和实现高 SLO 的方法和经验。 Why SLO? Gartner 对 SLO 的定义...

    文章 阿里巴巴云原生小助手 2020-11-06 2951浏览量

  • 分析演示: RIP动态路由协议引发的HSRP收敛问题

    演示目标: 1 动态路由协议在某种程度上可以帮助HSRP收敛无跟踪的盲点 2 动态路由协议RIP可能引发HSRP收敛的问题 3 为什么同一子网的主机,有些收敛快,有些慢? 演示环境:如图1所示的环境 背景说明:从实践的角度来讲,在需要部署HSRP进行三层冗余的环境中,通常物理链路也是成环的,那么这...

    文章 技术小阿哥 2017-11-21 1067浏览量

  • 《 软件测试价值提升之路》——3.3 受攻击出错

    本节书摘来自华章出版社《软件测试价值提升之路》一书中的第3章,第3.3节,作者:杨晓慧编著,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.3 受攻击出错 3.3.1 问题案例我们的产品中遇到的这类问题并不多见,最典型的就是春节、麦加朝觐时,由于通信需求骤然增大对产品产生的浪涌冲击。我...

    文章 华章计算机 2017-05-02 866浏览量

  • 排查一些常见的系统故障

    排除系统启动类故障     在Linux系统的启动过程中,涉及到MBR主引导记录、GRUB启动菜单、系统初始化配置文件、分区挂载配置文件等各方面,其中任何一个环节出现故障都可能会导致系统启动的失常,因此一定要注意做好相关文件的备份功能。 一、MBR扇区故障     MBR引导记录位于物理硬盘的第...

    文章 余二五 2017-11-23 1199浏览量

  • rac某节点asm磁盘启动失败故障定位及恢复

    RAC环境: oracle数据库:oracle11gr2 操作系统:rhel6.4_x86_64 故障现象:   1、rac其一个节点的oracle与asm相关的进程和实例启动失败;     查看方法:ps -ef|grep ora_                   ps -ef|grep ...

    文章 科技小能手 2017-11-14 1035浏览量

  • Ceph分布式存储学习指南3.2 Ceph RADOS

    3.2 Ceph RADOS RADOS是Ceph存储系统的核心,也称为Ceph存储集群。Ceph的所有优秀特性都是由RADOS提供的,包括分布式对象存储、高可用性、高可靠性、没有单点故障、自我修复以及自我管理等。因此,RADOS层在Ceph存储架构中扮演着举足轻重的角色。Ceph的数据访问方法...

    文章 华章计算机 2017-05-02 5669浏览量

  • 《深入理解Hadoop(原书第2版)》——2.3Hadoop系统的组成

    本节书摘来自华章计算机《深入理解Hadoop(原书第2版)》一书中的第2章,第2.3节,作者 [美]萨米尔·瓦德卡(Sameer Wadkar),马杜·西德林埃(Madhu Siddalingaiah),杰森·文纳(Jason Venner),译 于博,冯傲风,更多章节内容可以访问云栖社区“华章计...

    文章 华章计算机 2017-05-02 1340浏览量

  • Linux之系统故障分析与排查

    在处理Linux系统出现的各种故障时,故障的症状是最先发现的,而导致这以故障的原因才是最终排除故障的关键。熟悉Linux系统的日志管理,了解常见故障的分析与解决办法,将有助于管理员快速定位故障点。“对症下药”及时解决各种系统问题。 1、日志分析及管理 日志文件是用于记录Linux系统中各种运行消息...

    文章 科技小能手 2017-11-16 1580浏览量

  • Oracle RAC的五大优势及其劣势

    不同的集群产品都有自己的特点,RAC的特点包括如下几点:  ·双机并行。RAC是一种并行模式,并不是传统的主备模式。也就是说,RAC集群的所有成员都可以同时接收客户端的请求。   ·高可用性。RAC是Oracle数据库产品高可用性的解决方案,能够保证在集群中只要有一个节点存活,就能正常对外提供服务...

    文章 白展糖 2016-07-12 1276浏览量

  • linux 性能监控工具——NAGIOS 和 OVO

    Nagios是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。 Nagios是一个监视系统运行状态和网络信息的监视系统。N...

    文章 长烟慢慢 2012-12-17 1316浏览量

  • 车联网上云最佳实践(二)

    第一篇内容:《车联网上云最佳实践(一)》 二、传统IDC架构介绍及技术详解 俗话说知己知彼百战不殆,我们要上云首先要充分了解自己业务和应用架构。然后在充分了解云上产品的特性,看看哪些产品可以直接被我们使用,哪些是需要我们的应用或架构做出调整的。下面我们来分析下智能车联网平台的相关架构。   1、...

    文章 zkw9527 2018-08-22 2490浏览量

  • 如何解决AIX的文件系统故障

    在进行文件系统维护和管理过程中,会碰到这样一些问题,例如无法安装文件系统或者无法拆卸文件系统,当文件系统的超级块被破坏,而无法正常使用文件系统,如何修复rootvg中的主要文件系统,下面就讨论如何解决一些常见的文件系统问题。 一、恢复超级块错误 有些用户在使用fsck或mount命令时,当见到下面...

    文章 技术小胖子 2017-11-15 852浏览量

1 2 3 4 ... 9 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT