定位宕机的原因

  • 怎样管理Lotus Domino

    一个从事3年以上Lotus Domino的维护人员才能比较娴熟的处理一些复杂的问题,除了Lotus Domino以外,对于Lotus Domino所部署的主机操作系统,也要非常精通才行,因为一些大型的Lotus Domino系统必须依赖性能很强的Unix操作系统(Solaris或AIX等)。而有时...

    文章 技术小美 2017-11-09 1963浏览量

  • 11月9日科技联播:腾讯将投10亿资助青年科学家;百度网站出现大面积宕机

    腾讯10亿元设立“科学探索奖”,每年50人瓜分3千万;部分网友反馈百度宕机,百度回应系运营商DNS问题;阿里巴巴CEO张勇表示未来云计算将成为主要业务;谷歌要修改其性骚扰政策;特斯拉新任董事长将与马斯克形成制衡,一起来看今天的科技快讯: 腾讯宣布投入10亿元启动资金,资助青年科学家 腾讯宣布马化腾...

    文章 柚子菌 2018-11-09 964浏览量

  • 10月17日科技联播:谷歌公开承认中国“特供版”搜索引擎存在;YouTube出现全球大范围宕机

    谷歌首次公开表示将重新进入中国市场,中国定制的“特供版 Google”真的存在!YouTube出现全球大宕机,网页一片空白,遭遇网友疯狂吐槽;腾讯再度出击,上线音乐短视频应用“音兔”,短视频领域的又一布局,一起来看今天的科技快讯: 谷歌公开承认针对中国专门研发搜索引擎 谷歌首席执行官Sundar ...

    文章 柚子菌 2018-10-17 1169浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    0元试用32+款产品,最高免费12个月!拨打95187-1,咨询专业上云建议!

    广告

  • 为何helpdesk的电话总是那么多

    本文出自Simmy的个人blog:西米在线 http://simmyonline.com/archives/294.html   每天我们都忙于救火,忙于帮用户处理电脑故障。按照Gartner的IT成熟度模型的标准看,我们的IT仍属于最基本的成本中心阶段,典型的特点是应对型,头痛医头;问题驱动型...

    文章 技术小美 2017-11-11 723浏览量

  • 黑客与宕机

    宕机问题有一种比较少见的pattern,就是看起来完全不相关的机器同时出现宕机。处理这个pattern的问题,我们需要找到,在这些机器上能同时触发问题的条件。 通常,这些机器要么几乎在同一时间点出现问题,要么从某一个时间点开始,相继出现问题。对于前一种情况,比较常见的情形是,物理机故障导致运行在其...

    文章 声东 2018-05-04 2432浏览量

  • 黑客与宕机

    相信凡是与计算机高频亲密接触的人,都遇到过系统无响应,或突然重启的情况。这样的情况如果发生在客户端设备,如手机,或者笔记本电脑上,且不是频繁出现,基本上我们的解法就是鸵鸟算法,即默默重启设备,然后继续使用,当作什么都没发生过。 但是,如果这样的问题发生在服务端,比如运行微信、微博后台程序的虚拟机或...

    文章 茶什i 2020-07-17 615浏览量

  • HBase和Cassandra比较

    HBase是一个开源的分布式存储系统。他可以看作是Google的Bigtable的开源实现。如同Google的Bigtable使用Google File System一样,HBase构建于和Google File System类似的Hadoop HDFS之上。 Cassandra可以看作是Amaz...

    文章 雨客 2016-04-08 12911浏览量

  • rmq_vs_kafka

    RocketMQ与kafka对比(18项差异) 淘宝内部的交易系统使用了淘宝自主研发的Notify消息中间件,使用Mysql作为消息存储媒介,可完全水平扩容,为了进一步降低成本,我们认为存储部分可以进一步优化,2011年初,Linkin开源了Kafka这个优秀的消息中间件,淘宝中间件团队在对Kaf...

    文章 中间件小哥 2016-04-08 4235浏览量

  • 阿里基础设施的智能监控

    IDC、网络、服务器等基础设施承载了一次又一次的双十一奇迹。随着阿里集团业务全球化、多元化发展,作为整个集团之根本的基础设施,其运营水平显得愈发重要,智能监控成为了重中之重。 阿里IDC承载着为全球业务提供基础服务的重担,服务的稳定性和可用性有着极高的业务要求,同时又面临全球机房环境迥异、设施链条...

    文章 初商 2019-07-30 875浏览量

  • 使用云监控和函数计算,秒级恢复故障

    云监控发布新feature,打通事件中心和函数服务,可以实现秒级故障恢复。 试想这样一个场景: 当ecs宕机时,在几秒内实现eip自动迁移至另一个健康的ecs实例,快速故障恢复,避免损失。 如何做到? 云监控之前推出了事件中心,定位于,将阿里云上发生的对用户有影响的事件,集中起来,统一展示,统一管...

    文章 裴旻 2018-08-06 10350浏览量

  • 使用云监控和函数计算,秒级恢复故障

    云监控发布新feature,打通事件中心和函数服务,可以实现秒级故障恢复。 试想这样一个场景: 当ecs宕机时,在几秒内实现eip自动迁移至另一个健康的ecs实例,快速故障恢复,避免损失。 如何做到? 云监控之前推出了事件中心,定位于,将阿里云上发生的对用户有影响的事件,集中起来,统一展示,统一管...

    文章 江米 2018-08-07 1555浏览量

  • Mocha BSM应用管理——Portal监控与管理

    业务需求与挑战 Portal给企业带来了三个统一:  统一页面展现  统一资源管理,包括通过LDAP来管理认证和权限信息  统一登入,即Single Sign On (SSO) 这些技术上的创新给客户带来前所未有的方便,但是同时成为一个IT系统的大隐患。如果Portal宕了,几乎所有后台的应...

    文章 技术小美 2017-11-11 815浏览量

  • 阿里如何做到百万量级硬件故障自愈?

    随着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务之前实现硬件故障自动闭环策略,对于常见的硬件故障无需人工干预...

    文章 隐林 2018-11-24 3263浏览量

  • 阿里如何做到百万量级硬件故障自愈?

    随着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务之前实现硬件故障自动闭环策略,对于常见的硬件故障无需人工干预...

    文章 技术小能手 2018-11-19 2450浏览量

  • TFS分布式文件系统应用

    TFS是淘宝开源的一套高性能文件存储系统,在阿里广泛应用,除了自建文件系统,在应用上云的大趋势下,还可以使用阿里云的对象存储OSS服务:阿里云对象存储OSS首页 一、关于TFS TFS(Taobao File System)是一个高可扩展、高可用、高性能、面向互联网服务的分布式文件系统,主要针对海...

    文章 邴越 2017-10-13 5139浏览量

  • 【IaaS&PaaS】为什么选择PaaS?

    何为PaaS 地球人都知道PaaS就是Platform as a Service的缩写,但到底什么是PaaS呢? 假如我们现在需要一个业务,提供一个很简单的"hello world"服务,那么需要的资源有哪些呢,看下图: IaaS&PaaS覆盖图 从最底层的IDC、机房、网络、服务器,到...

    文章 晚来风急 2017-08-02 3172浏览量

  • 海量数据下的注册中心 - SOFARegistry 架构介绍

    SOFAStack Scalable Open Financial Architecture Stack 是蚂蚁金服自主研发的金融级分布式架构,包含了构建金融级云原生架构所需的各个组件,是在金融场景里锤炼出来的最佳实践。 SOFARegistry 是蚂蚁金服开源的具有承载海量服务注册和订阅能力的、...

    文章 初商 2019-08-01 612浏览量

  • 服务器运维的日常维护工作有哪些

    一、认识服务器 良知知彼才气百战不殆,假如对本身维护的服务器都不相识,何故能正确办理服务器宕机、补丁安装,裂痕修复等问题。 1.服务器操纵系统范例,版本,补丁版本; 2.服务器硬盘利用率; 3.服务器运行业务的环境; 4.服务器网络设置环境等。 二、按期查抄 1.服务器电源状态查抄; 2.服务器电...

    文章 zhubaojie 2018-07-07 2162浏览量

  • 海量数据下的注册中心 - SOFARegistry 架构介绍

    SOFAStackScalable Open Financial Architecture Stack 是蚂蚁金服自主研发的金融级分布式架构,包含了构建金融级云原生架构所需的各个组件,是在金融场景里锤炼出来的最佳实践。 SOFARegistry 是蚂蚁金服开源的具有承载海量服务注册和订阅能力的、高...

    文章 花肉酱 2019-08-06 2780浏览量

  • 给飞驰的法拉利换引擎 - 谈边做业务边做架构重构(1)

    序言 对一个程序员来说,世界上最痛苦的事情是什么呢? 有的人会说:编码的时候产品改需求! 有的人会说:看别人不知所云的代码! 有的人会说:定位一个百年不遇千年难寻的线上不定时偶尔出现的bug! 有的人会说:找不到女(男)朋友! 。。。。。。。。。。。。。。。。。。。。。。。。。。 但我要说,这些痛...

    文章 华仔爱技术 2016-05-12 7223浏览量

  • 海量数据下的注册中心 - SOFARegistry 架构介绍

    SOFAStackScalable Open Financial Architecture Stack 是蚂蚁金服自主研发的金融级分布式架构,包含了构建金融级云原生架构所需的各个组件,是在金融场景里锤炼出来的最佳实践。  SOFARegistry 是蚂蚁金服开源的具有承载海量服务注册和订阅能力的...

    文章 s潘潘 2019-04-26 887浏览量

  • HBase运维实践-聊聊RIT的那点事

    相信长时间运维HBase集群的童鞋肯定都会对RIT(Region-In-Transition,很多参考资料误解为Region-In-Transaction,需要注意)有一种咬牙切齿的痛恨感,一旦Region处于长时间的RIT就会有些不知所措,至少以前的我就是这样过来的。正所谓“恐惧来源于未知”,不...

    文章 知与谁同 2017-08-01 1416浏览量

  • MySQL数据库的几种常见高可用方案

    随着人们对数据一致性的要求不断的提高,越来越多的方法被尝试用来解决分布式数据一致性的问题,如MySQL自身的优化、MySQL集群架构的优化、Paxos、Raft、2PC算法的引入等等,本文介绍MySQL数据库的几种常见高可用方案。 一、概述 我们在考虑MySQL数据库的高可用的架构时,主要要考虑...

    文章 云市场转载 2017-04-25 12042浏览量

  • Windows主机IIS7恢复实战

    Windows主机IIS7恢复实战 症状:administrator账号打不开c:/inetpub目录 原因:因为服务器被挂马,引起服务器异常所有的网页文件都放在c:/inetpub,于是造成网站全部崩溃 策略:挂起一块新磁盘作为系统,然后扫描磁盘杀死病毒和木马,恢复原磁盘的文件管理权限,切换到源...

    文章 科技小能手 2017-11-14 695浏览量

  • 系列文章:云原生Kubernetes日志落地方案

    在Logging这块做了几年,最近1年来越来越多的同学来咨询如何为Kubernetes构建一个日志系统或者是来求助在这过程中遇到一系列问题如何解决,授人以鱼不如授人以渔,于是想把我们这些年积累的经验以文章的形式发出来,让看到这篇文章的同学能少走弯路。这个系列文章定位为长篇连载,内容偏向落地实操以及...

    文章 元乙 2019-09-08 10190浏览量

  • RocketMQ 客户端最佳实践

    本文站在消费者和生产者的角度给出一些RocketMQ客户端使用的实践意见。 一、Producer最佳实践 发送消息注意事项 一个应用尽可能用一个Topic,消息子类型用tags来标识,tags可以由应用自由设置。只有发送消息设置了tags,消费方在订阅消息时,才可以利用tags在broker做...

    文章 尘央 2016-12-09 10226浏览量

  • 系统设计之——架构师职责和设计原则

    1.架构师职责 分布式存储系统架构师的工作不仅在于整体架构设计,还需要考虑清楚关键实现组节,做到即使只有自己一人也可以把系统做出来,只是需要花费更多的时间而已。 架构师的主要工作包括: 1)权衡架构,从多种设计方案中选择一种与当前团队能力最为匹配的方案。架构设计的难点在于权衡,架构师需要能够在理解...

    文章 凌洛 2018-11-18 2055浏览量

  • 根本原因分析 关键事件关联 IT运维有序发展——中国联通通讯集团

    ·案例背景    中国联通经过几年的信息化建设,已经建成了统一信息平台Portal、BPM、OA等多个应用系统。企业各个业务所需要的应用系统,极大地提升了企业的信息化水平,提高了工作效率,基本实现了无纸化办公。 随着应用系统越来越多、越来越深入,员工的日常工作已离不开这些应用系统,应用系统的运行状...

    文章 技术小美 2017-11-09 1446浏览量

  • 走近华佗,解析自动化故障处理系统背后的秘密

    集群医生华佗是集群自动化故障监测和处理系统,是平台和运维对接的关键系统。一方面完成飞天其他组件不擅长的OS和硬件的故障自动监测和处理,另一方面推动飞天去及时规避硬件和OS引起的故障,使得故障能够闭环运转,大幅度减少故障处理成本和造成的影响。飞天5K项目期间的规模效应凸显出自动化处理故障的必要性,大...

    文章 yq传送门 2016-12-18 4331浏览量

  • “十年磨一剑”--有赞的HBase平台实践和应用之路

    在中国HBase技术社区第十届meetup杭州站中,有赞数据开发工程师赵原向大家分享了HBase在有赞的产品定位,重点介绍了有赞HBase和相关管控平台的研发建设、以及在HBase 1.2.6版本之上所做的改造、改造原因以及给业务实践带来的价值。 以下内容根据演讲嘉宾视频分享以及PPT整理而成。 ...

    文章 hbase小能手 2019-03-21 3150浏览量

1 2 3 4 ... 7 >

云产品推荐

阿里云大学 云服务器ECS com域名 网站域名whois查询 开发者平台 小程序定制 小程序开发 国内短信套餐包 开发者技术与产品 云数据库 图像识别 开发者问答 阿里云建站 阿里云备案 云市场 万网 阿里云帮助文档 免费套餐 开发者工具 企业信息查询 小程序开发制作 视频内容分析 企业网站制作 视频集锦 代理记账服务 企业建站模板