• 关于

    业务管理点故障原因

    的搜索结果
  • 智能化网络管理 为企业信息化保驾护航

         随着目前信息化突飞猛进的发展,科技改变了我们的生活,提高了我们工作的效率,甚至还能通过准确的数据分析帮助我们进行各类的管理。IT技术已经成为了我们工作和生活中不可缺少的重要工具。IBM公司曾经提出了“智慧地球”的远大目标,并受到美国总统奥巴马大力的赞赏,甚至将此概念作为美国在今后继续保持...

    文章 技术小美 2017-11-08 749浏览量

  • 带你读《智能制造之卓越设备管理与运维实践》之三:运维资源信息化管理

    点击查看第一章点击查看第二章 第3章 运维资源信息化管理要实现高效运维,首先要实现资源的高效管理。借助信息化手段,可以将运维资源中的技术、员工、备件、数据进行有效整合,为高效运维奠定良好的基础。本章的结构如图3-1所示。 3.1 管理需求 基于精益管理思想,工厂在生产管理过程中,会通过各种方式来...

    文章 温柔的养猫人 2019-11-08 633浏览量

  • Hyper-V Server Replica

    Hyper-V Server副本技术伴随着Windows Server 2012、Hyper-V Server 2012一同发布的新技术,他是Hyper-V 2012/R2中的免费灾难恢复工具,用于创建和维护虚拟机(VM)副本。在有灾难性的损失的情况下,管理员可以转移到副本虚拟机,保障了业务连续性...

    文章 技术小胖子 2017-11-03 858浏览量

  • Hyper-V Server Replica

    Hyper-V Server副本技术伴随着Windows Server 2012、Hyper-V Server 2012一同发布的新技术,他是Hyper-V 2012/R2中的免费灾难恢复工具,用于创建和维护虚拟机(VM)副本。在有灾难性的损失的情况下,管理员可以转移到副本虚拟机,保障了业务连续性...

    文章 技术小胖子 2017-11-10 914浏览量

  • 架构设计 | 分布式体系下,服务分层监控策略

    一、分布式故障 分布式系统的架构,业务开发,这些在良好的思路和设计文档规范之下,是相对来说好处理的,这里的相对是指比较分布式架构下生产环境的突然故障。 在实际的开发中,有这样一个很妖娆的情况:越是核心复杂的业务,越是担心出问题,越容易出问题。 所以当核心服务的链路出现故障时,如何快速定位问题就是...

    文章 知了一笑 2020-09-17 314浏览量

  • 还不知道AIOps嘛?阿里这么火的智能运维,你不能不知道!

    摘要:业务通过产品技术发挥价值的一个必要条件就是可以在线上稳定持续的运行,这一直是运维人员的终极目标。相信大家在使用天猫、淘宝、支付宝时几乎没有遇到过无法使用的情况,阿里是如何做到的呢?AIOps又是什么?本文主要关注线上业务的研发和运维流程,由阿里云高级技术专家向大家介绍如何将机器学习算法引入运...

    文章 聒小小噪 2018-05-30 10733浏览量

  • 高性能Web应用的六个好习惯

      为了提供与你的业务目标一致的的服务,管理你的Web应用程序是非常重要的。CA公司副总裁Prabhjot Singh讨论了企业应该发展的6个好习惯,以便提供高Web应用程序的性能。   在迅速发展的Web应用程序服务环境中,业务事务处理要很好地传送。这些业务事务处理通过网络、应用服务器、防火墙和...

    文章 lzhdim 2009-02-12 644浏览量

  • 服务器不正常运行就找服务器租用商?

    在使用服务器过程中,服务器不能正常运行这个问题相信很多企业都遇到过,那么是不是服务器出现问题就要找IDC运营商?一切都是IDC运营商的责任呢?下面就给大家简单分析服务器不正常运行的原因。 1、服务器所在的机房设备出现故障 服务器所在机房设备偶尔的故障问题,会造成服务器运行异常。成立多年的数据中心机...

    文章 行者武松 2017-07-04 894浏览量

  • 《Cisco IOS XR技术精要》一2.7 高可用架

    本节书摘来自异步社区《Cisco IOS XR技术精要》一书中的第2章,第2.7节,作者 【美】Mobeen Tahir , Mark Ghattas , Dawit Birhanu , Syed Natif Nawaz,更多章节内容可以访问云栖社区“异步社区”公众号查看 2.7 高可用架构 Ci...

    文章 异步社区 2017-05-02 1122浏览量

  • 根本原因分析 关键事件关联 IT运维有序发展——中国联通通讯集团

    ·案例背景    中国联通经过几年的信息化建设,已经建成了统一信息平台Portal、BPM、OA等多个应用系统。企业各个业务所需要的应用系统,极大地提升了企业的信息化水平,提高了工作效率,基本实现了无纸化办公。 随着应用系统越来越多、越来越深入,员工的日常工作已离不开这些应用系统,应用系统的运行状...

    文章 技术小美 2017-11-09 1464浏览量

  • 面向失败的设计-故障与攻防演练锤炼容灾应急能力

    引言阿里巴巴经过多年的技术演进,系统工具和架构已经高度垂直化,服务器规模也达到了比较大的体量。当服务规模大于10000台时,小概率的硬件故障每天都会发生。这时如果需要人的干预,系统就无法可靠的伸缩。为此每一层的系统都会面向失败做设计,对下游组件零信任,确保在故障发生时可以快速的发现和处理。 不过这...

    文章 KB小秘书 2019-11-08 622浏览量

  • 如何实现32.5万笔/秒的交易峰值?阿里交易系统TMF2.0技术揭秘

    交易平台遇到的挑战 2017双11,交易峰值达到了32.5万笔/秒,这给整个交易系统带来了非常大的挑战。 一方面,系统需要支撑全集团几十个事业部的所有交易类需求:要考虑如何能更快响应需求、加快发布周期;如何能为新小业务提供快速支撑、降低准入门槛;是否足够开放使得业务方能做到自助式扩展;新需求是否已...

    文章 技术小能手 2018-03-06 9175浏览量

  • 详解K-DB RAC集群下的锁机制管理(一) ——K-DB与锁技术的演进

    集群功能是数据库产品高可用性的重要一环,集群架构是保障业务连续性的核心架构,体现着数据产品的高可用性和技术水准。但在业界集群架构有多种方案和技术,其中最具稳定性、最能够保障业务连续性的架构当属于RAC集群,即Real Application Cluster。RAC集群特点是多个数据库节点共享存储,...

    文章 云栖大讲堂 2017-09-01 959浏览量

  • 详解K-DB RAC集群下的锁机制管理(一) ——K-DB与锁技术的演进

    集群功能是数据库产品高可用性的重要一环,集群架构是保障业务连续性的核心架构,体现着数据产品的高可用性和技术水准。但在业界集群架构有多种方案和技术,其中最具稳定性、最能够保障业务连续性的架构当属于RAC集群,即Real Application Cluster。RAC集群特点是多个数据库节点共享存储,...

    文章 晚来风急 2017-09-04 974浏览量

  • 超全总结 | 阿里如何应对电商故障?神秘演练细节曝光

    近日,在 QCon北京2017大会上,来自阿里巴巴中间件团队的技术专家周洋(花名中亭)发表了题为《阿里电商故障治理和故障演练实践》专题演讲。在会后官方组织的评选中,本次演讲的内容得到了一致好评,中亭获选为本次大会的明星讲师。此次演讲整体上分享了从 2011 年至今,阿里巴巴电商平台遇到的诸多有代表...

    文章 技术小能手 2017-06-19 3389浏览量

  • 阿里如何做到百万量级硬件故障自愈?

    随着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务之前实现硬件故障自动闭环策略,对于常见的硬件故障无需人工干预...

    文章 隐林 2018-11-24 3321浏览量

  • 《Oracle数据库性能优化方法论和最佳实践》——1.6 基线管理

    本节书摘来自华章计算机《Oracle数据库性能优化方法论和最佳实践》一书中的第1章,第1.6节,作者:柳遵梁 潘敏君 应以峰著,更多章节内容可以访问云栖社区“华章计算机”公众号查看 1.6 基线管理 1.6.1 基准点和基线人们在谈论Oracle业务系统的性能时通常会说它运行得快或慢,但大家都知道...

    文章 华章计算机 2017-05-02 958浏览量

  • 使用云监控和函数计算,秒级恢复故障

    云监控发布新feature,打通事件中心和函数服务,可以实现秒级故障恢复。 试想这样一个场景: 当ecs宕机时,在几秒内实现eip自动迁移至另一个健康的ecs实例,快速故障恢复,避免损失。 如何做到? 云监控之前推出了事件中心,定位于,将阿里云上发生的对用户有影响的事件,集中起来,统一展示,统一管...

    文章 裴旻 2018-08-06 10427浏览量

  • 阿里如何做到百万量级硬件故障自愈?

    随着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务之前实现硬件故障自动闭环策略,对于常见的硬件故障无需人工干预...

    文章 技术小能手 2018-11-19 2649浏览量

  • 使用云监控和函数计算,秒级恢复故障

    云监控发布新feature,打通事件中心和函数服务,可以实现秒级故障恢复。 试想这样一个场景: 当ecs宕机时,在几秒内实现eip自动迁移至另一个健康的ecs实例,快速故障恢复,避免损失。 如何做到? 云监控之前推出了事件中心,定位于,将阿里云上发生的对用户有影响的事件,集中起来,统一展示,统一管...

    文章 江米 2018-08-07 1581浏览量

  • (四):C++分布式实时应用框架——状态中心模块

    C++分布式实时应用框架——状态中心模块   上篇:(三):C++分布式实时应用框架——系统管理模块     技术交流合作QQ群:436466587 欢迎讨论交流     版权声明:本文版权及所用技术归属smartguys团队所有,对于抄袭,非经同意转载等行为保留法律追究的权利!     状态中心...

    文章 smartguys 2017-12-14 1041浏览量

  • 深入探讨运维驱动的可监控性设计

    “外部质量验收驱动技术债务消除”的理念: 技术债务的形成往往是由于赶进度忽略了非功能质量特性而导致的,由于内部质量的不佳(设计或代码质量不高)导致外部质量的低下。 传统IT领域通常有上线前的验收测试,如果能够在验收测试过程中重点关注非功能需求的实现质量,则可以“由外而内”地驱动开发团队在开发过...

    文章 努力酱 2017-05-02 1367浏览量

  • 走近华佗,解析自动化故障处理系统背后的秘密

    集群医生华佗是集群自动化故障监测和处理系统,是平台和运维对接的关键系统。一方面完成飞天其他组件不擅长的OS和硬件的故障自动监测和处理,另一方面推动飞天去及时规避硬件和OS引起的故障,使得故障能够闭环运转,大幅度减少故障处理成本和造成的影响。飞天5K项目期间的规模效应凸显出自动化处理故障的必要性,大...

    文章 yq传送门 2016-12-18 4466浏览量

  • 创建数据中心监控方案的最佳实践方案

    本文中,我们将略过关于IT更新的一系列统计数据和趋势的简介,而把关注焦点聚焦于您的数据中心的监控实践方案。 我曾经有幸能够有机会与各种类型的数据中心环境合作过。是的,这些数据中心的环境类型都各有不同。一些数据中心采用电源HPC工作负载,而其他数据中心则使用云工作负载。然后,还有一些数据中心充当了存...

    文章 泡泡浅眠 2017-07-04 1250浏览量

  • AIOps智能监控在阿里巴巴故障管理工作中的成功实践

    摘要:在自动化运维还不普及的时候,运维人员更多的运用手动的方式完成运维工作,这种方式耗时长,效率低。由此,如何合理发挥人工智能技术辅助运维人员进行故障管理工作逐步成为了业界关注的焦点。阿里巴巴的GOC团队通过研究并使用AIOps系统到运维业务场景中的方式,积累了大量的智能运营的方法论和技术体系。 ...

    文章 止水如心 2018-06-26 5234浏览量

  • heartbeat基础知识

    HeartBeat介绍 HeartBeat的作用:   通过HeartBeat,可以将资源(IP以及程序服务等资源)从一台已经故障的计算机快速转移到另一台正常运转的机器上继续提供服务,一般称之为高可用的服务。在实际的生产应用场景中,heartbeat的功能和另一个高可用的开源软件keepalive...

    文章 技术小阿哥 2017-11-27 881浏览量

  • 实战课堂:数据库高Library Cache Lock导致Hang的故障分析

    案情描述: 客户数据库发生hang现象,大量业务操作超时,DBA介入分析。 通过OEM控制台的监控工具,可以看到客户数据库的“平均活动会话数”从21点开始active session出现明显增长,最高超过60个直至10点左右恢复。 在图上出现一个明显的“波峰”,且等待事件类为concurrency...

    文章 技术小能手 2018-05-29 2691浏览量

  • 双11 背后的全链路可观测性:阿里巴巴鹰眼在“云原生时代”的全面升级

    本文节选自《不一样的 双11 技术:阿里巴巴经济体云原生实践》一书 作者:周小帆(承嗣)  阿里云中间件技术部高级技术专家王华锋(水彧)  阿里云中间件技术部技术专家徐彤(绍宽)  阿里云中间件技术部技术专家夏明(涯海)  阿里云中间件技术部技术专家 导读:作为一支深耕多年链路追踪技术 (Trac...

    文章 阿里巴巴云原生小助手 2019-12-20 432浏览量

  • 阿里集团搜索和推荐关于效率&稳定性的思考和实践

    背景 效率和稳定性是我们从工程层面来衡量系统对业务支持能力的两个关键指标。从流程管控上来看,业务效率的提升一定程度上会影响到稳定性,而对稳定性要求过高又会带来对业务效率的影响。从业务的角度来看,成熟的业务会更偏向于稳定性,而新业务更偏向于效率。效率和稳定性兼顾,也就变成了一个巨大的挑战。 我们理解...

    文章 李伟-剑豪 2018-02-11 5031浏览量

  • 阿里双11网络技术揭秘:百万级物理和虚拟网络设备的智能化之路

    阿里巴巴资深技术专家后羿 后羿:大家好,首先给大家呈现的是阿里巴巴在双11中主要依赖的网络相关技术。在今年双11中我们在稳定性、高性能网关、去堆叠以及25G、骨干网流量调度平台、流量的精准评估、QOS优化和成本优化方面都取得了突破性的进展。 助力双11的重要网络技术 在稳定性的强化方面,在过去一年...

    文章 技术小能手 2018-01-05 4713浏览量

1 2 3 4 ... 32 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务