• 如何处理IT事件管理以避免混乱

    了解所管理的IT平台的物理体系结构;了解管理下的IT平台的虚拟架构,包括公共云平台;完全理解虚拟和物理实体之间的所有依赖关系;快速找到发生的IT事件并记录日志;对事件进行根本原因分析并记录;确定事件是否可以通过...
    文章 2017-07-03 1103浏览量
  • 《架构师》反思:系统可靠性

    最近系统学习了一个系统可靠性及其相关知识,今天在这总结一下。首先,什么是系统的可靠性呢?系统的可靠性是指在规定的时间...目前对高可靠性软件如何实话软件测试技术仍是一个颇不成熟的领域,缺少一种体系化的方法
    文章 2016-05-05 4862浏览量
  • 大数据分析(46PPT)

    基本上就是宕机,运行不下去。我们采用一些新的技术帮助解决数据量大的问题。这三项技术目前是比较普遍采用的技术。第一,网格计算,网格计算其实就是分布式计算,我们把要处理的数据放在不同的机器上运行,运行完了...
    文章 2017-05-02 1500浏览量
  • 应用运维——《应用智能运维实践(试读版)》

    系统故障和宕机频率快速升高&xff0c;人工运维成本飙升。著名管理咨询公司麦肯锡在名为Measuring the Net’s Growth Dividend的分析报告中指出&xff0c;2013—2025年&xff0c;互联网将帮助中国的GDP增长率提升0.3&xff5e;1....
    文章 2021-07-06 340浏览量
  • 带你读《智能制造之卓越设备管理与运维实践》之一:...

    2008年版本更新之后,PAS 55规范包括了从全生命策略到日常维修管理最佳实践的28个方面,企业可结合自身现状,识别与最佳实践的差距,分析原因,提出解决方案,实现企业在资产(设备)管理方面的持续改进。...
    文章 2019-11-08 1321浏览量
  • 云时代如何实现企业IT智能诊断?...

    而此时可能服务器已经宕机,只能被迫宕机才能解决问题、恢复业务。随着云时代的到来,智能诊断则是针对传统监控的一场革命,表现在: 诊断范围对象扩大:不仅可以诊断传统IT环境,同时可以诊断多种云环境;不仅...
    文章 2019-04-12 1543浏览量
  • 开源AIOps数据中台搭建

    SLA表示客户与服务商之间服务可用性的承诺,一般以服务可用性用时长为维度,例如99.99%可用,表示一个周期(例如一个月)宕机的总体时间不超过0.01%*365天<4.5分钟。有时也表示API错误率占比。IT运维挑战 但是IT...
    文章 2019-12-31 6532浏览量
  • 智能运维——《应用智能运维实践(试读版)》

    这说明应用软件的用户体验下降或宕机将直接导致用户流失&xff0c;当前企业经营运转比以往更依赖应用软件。除此之外&xff0c;近年来新技术、新需求的涌现促使企业拥有的应用规模和复杂度快速膨胀&xff0c;企业原有的IT运维...
    文章 2021-07-06 311浏览量
  • 云栖科技评论第70期:数字时代需要双螺旋

    【新闻摘要】据台湾《中时电子报》8月4日报道,晶圆代工业巨头台积电在3日晚受到电脑病毒攻击,造成竹科晶圆12厂、中科晶圆15厂、南科晶圆14厂等主要厂区的设备宕机、生产线停线。对此消息,台积电证实内部系统确实...
    文章 2018-08-13 2453浏览量
  • 如何建设省时省力的BI平台?

    同时也有智能波动分析,如下示例,当订单金额出现比较大的波动情况时,可以通过波动原因分析来查看具体造成订单金额变化的原因和贡献占比,提供分析结果给业务用户参考。2.3IT赋能方案 以上都是业务关注的数据应用...
    文章 2020-09-21 7625浏览量
  • 使用 HAProxy,PHP,Redis 和 MySQL 轻松构建每周上亿...

    系统体系结构必须被设计为可扩展的方式,来实现扩展到下一个市场的计划。所以我们只好来了,检查他们的基础设施. 以前的系统是以整体方式设计的。具体来说是一些独立的基于PHP的Web应用程序(在新兴公司有很多所谓的...
    文章 2014-11-17 930浏览量
  • 含PPT下载|李飞飞:如何看待数据库的未来?

    此外,还有读和写的冲突问题,比如在数据库里做批量写入的时候系统宕机,应该考虑如何让系统自动恢复。为解决以上的问题,数据库系统提出了一个核心概念——事务。简单而言,事务就是一系列动作可以被看作一个整体,...
    文章 2020-02-25 8192浏览量
  • CPU静默数据错误:存储系统数据不丢不错的设计思考

    在某些情况下硬件能检测错误但是无法校正,并且这些错误要对用户可见,典型如宕机崩溃。静默数据错误。此类错误既没有被硬件检测到,也没有被通知给操作系统,但是数据就是被 CPU 写到了内存,从而无法知道它是错误...
    文章 2021-07-01 3045浏览量
  • 智能、互联时代的应用运维——《应用智能运维实践...

    网络性能监控分析软件和应用性能管理软件也在这个阶段诞生了。以智能、互联为主要特征的第三次信息技术浪潮将在提升生产力的同时&xff0c;改变应用及其运维方式。物联网&xff08;Internet of Things&xff0c;IoT&xff09;...
    文章 2021-07-06 343浏览量
  • 带你读《企业私有云建设指南》之二:企业云计算涉及的...

    高可用性即在硬件出问题时保证虚拟机的正常工作,当然如果真的出错了,则只能在不同的ESXi主机上启动虚拟机,这也可能造成服务的中断。FT(容错)的主要功能就是保证在出现故障时用户的应用不会出现中断。其原理就是...
    文章 2019-10-31 2762浏览量
  • 五分钟学后端技术:一篇文章告诉你什么是云计算!

    所以一台服务器上的容器是共享操作系统内核的,容器在不同机器之间的迁移不带内核,这也是很多人声称容器是轻量级的虚拟机的原因。轻不白轻,自然隔离性就差了,一个集装箱把船压漏水了,所有的集装箱一起沉。另一个...
    文章 2020-04-02 2518浏览量
  • 应用运维智能化的关键技术——《应用智能运维实践...

    推断异常出现的位置及原因&xff0c;并给予初步的建议解决方案&xff0c;则将对系统状态稳定起到巨大的作用。传统的时间序列数据异常检测方法通常聚焦在一维场景下&xff0c;根据不同时间点数据样本间的关联来对异常进行判断...
    文章 2021-07-06 441浏览量
  • Linux必会原理之输入网址到看到页面内容原理

    503 services unavailable 服务器不可用,可能是服务器超载或者宕机,或者反向代理后面没有提供服务的节点 504 Gateway timeout 代理向后请求,后端在一定时间内没有给反馈,造成的超时。下面看看响应头部,...
    文章 2017-11-28 1274浏览量
  • 带你读《C++代码整洁之道:C++17 可持续软件开发模式...

    T公司的曼哈顿控制中心首先爆发出来,随后引起连锁反应,并导致整个通信网络中近半数的设备宕机。在此事故中,估计损失6000万美元,而在通信网络瘫痪的9个小时内产生的经济损失远高于这一数字。2.2 测试入门 在软件...
    文章 2019-11-01 961浏览量
  • Java开发面试题汇总-精选版(附答案)

    Spring IOC体系结构: Spring Bean的创建是典型的工厂模式,这一系列的Bean工厂,也即IOC容器为开发者管理对象间的依赖关系提供了很多便利和基础服务,在Spring中有许多的IOC容器的实现供用户选择和使用,其相互关系...
    文章 2019-04-22 3539浏览量
  • 阿里云基础产品技术月刊 2019年3月

    阿里云日志服务是面向日志类数据的智能化一站式平台,针对AIOps场景,新增面向趋势预测、异常发现、智能聚类、根因分析(推导)等4个高频场景系列函数,从异常的识别、分析的过程到最后的原因定位均有涉及,通过这些...
    文章 2019-04-11 4426浏览量
  • 蚂蚁变大象:浅谈常规网站是如何从小变大的

    但是这种方案有一个致命的问题,当一台机器宕机了以后,该机器上的所有用户的session信息即会丢失,即使是做了磁盘备份,也会有一段时间出现session失效。好,那看看第一种方案。其实现在有一些框架已经提供了这样的...
    文章 2017-11-07 1323浏览量
  • [转载]聊聊Greenplum的那些事

    这也是我们在用户选型时,通常建议用户考察一下底层的技术支撑是不是有好的组织和社区支持的原因,如果缺乏这方面的有力支持或独自闭门造轮,那就有理由为那个车的前途感到担忧,一个简单判断的标准就是看看底下那个...
    文章 2016-07-11 7151浏览量
  • 云栖PPT下载|开源界大咖集体现身,开源数据库专场重点...

    下图是典型的DRDS部署拓扑,图左侧分为两层,Server层包含多个无状态的DRDS节点,DRDS节点向Load Balancer汇报心跳,如果出现宕机,Load Balancer就会将流量迁移到其他节点上,保证集群高可用。存储层可能使用RDS、...
    文章 2019-10-17 2226浏览量
  • 面试题有哪些

    ​使用int的原因是,对于当下32位的处理器(CPU)来说,一次处理数据是32位(这里不是指的是32/64位系统,而是指CPU硬件层面),具有高效存取的特点。标识符的命名规则?标识符的含义 是指在程序中,我们自己定义的...
    文章 2021-10-07 41浏览量
  • 带你读《并发模式与应用实践》之一:并发简介

    在任何一个节点出现故障(硬件故障)的情况下,其他冗余节点都将取而代之,从而确保整个系统永远不会宕机。1.1.2 分时 在现实生活中,我们也同时执行着许多任务。我们专心处理一项任务时,如果另一项任务也需要处理...
    文章 2019-11-04 1294浏览量
  • 【区块链丨主题周】区块链信用机制与应用场景介绍

    现实世界中大量的场景都具有这种模式的发挥空间,这是区块链目前被人们寄予厚望的原因所在。区块链是由多个独立节点参与的分布式数据库系统,也称分布式账簿(Distributed Ledger Technology,DLT),所有参与的节点...
    文章 2018-04-04 2638浏览量
  • 区块链信用机制与应用场景介绍

    现实世界中大量的场景都具有这种模式的发挥空间,这是区块链目前被人们寄予厚望的原因所在。区块链是由多个独立节点参与的分布式数据库系统,也称分布式账簿(Distributed Ledger Technology,DLT),所有参与的节点...
    文章 2018-07-30 1811浏览量
  • Redis集群技术及Codis实践

    另外Codis源码、体系结构及FAQ,参见如下链接:https://github.com/wandoulabs/codis PS:线上文档的可读性,也是相当值得称赞的地方。一句话:很走心,赞!最后,Redis初学者请参考这个链接:...
    文章 2017-05-02 1767浏览量
  • 高可用之2——存储b

    比如有人问,我们有一个磁盘阵列,连到了两个主机上,我们划分了一个lun给两个主机,然后我们想,先在操作系统将磁盘分为两个区,让两个主机分别使用两个分区,然后再出现某一台主机宕机之后,使用集群软件将该分区...
    文章 2012-06-02 1344浏览量
1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化