• 高效处理数据中心故障的八条军规

    数据中心要全天候运行,难免会出现这样那样的故障。出现故障后,如何迅速找到故障原因并消除故障是一个数据中心运维效率的最直接体现。数据中心一旦发生故障,影响了数据业务,将给数据中心带来巨大的经济损失,有时...
    文章 2017-07-06 988浏览量
  • 浅谈物联网智能设备数据安全面临的挑战

    在风力发电机的例子中,如果你将单个加速度计的数据与涡轮机其他加速度计的数据相关联,以及其他信息(例如涡轮机的输出),你很快可以确定传感器数据是否有问题以及这是否表明涡轮机即将出现故障。如果功率输出没有...
    文章 2017-08-25 2327浏览量
  • 浅谈IT运维

    运维人员在做这类工作的时候不能像应付任务那样,但求过关即可,否则日积月累下来,服务器会出现意想不到的情况。在处理这类工作上运维人员应当做到规范和文档记录,长期做下来,不但自己的运维专业水平会提高,对于...
    文章 2017-11-20 1601浏览量
  • 如何快速处理线上故障【转】

    故障定位的初期,一般会先通过邮件+电话的方式进行沟通,如果几分钟之后事态变糟糕,且没有眉目,则需要紧急启动会议形式的联合排障,所有相关人员需要放下手头事情,集中到一个特定会议室进行联合排障。这样的好处...
    文章 2017-11-16 1626浏览量
  • 数据保驾护航,BIWIN佰维断电保护企业级SSD

    会出现固态硬盘无法被系统识别,只能通过返厂维修,而返厂后是通过重新开卡(初始化硬盘)的方式进行维修,用户数据全部丢失是必然的。如何实现断电保护 断电保护愈加成为企业用户关注重点,通过断电保护架构,在...
    文章 2017-07-03 1391浏览量
  • 轻松应对双11,百万级物理和虚拟网络设备的网络智能化...

    在自动隔离场景中,由于网络设备在运行过程中经常会出现故障,在快速修复之前前,隔离是在网络工程师解决问题的首要工作。从图中可以看出,自动隔离功能上线后,90%以上的隔离操作能自动完成,而且成功率高达95%,...
    文章 2017-12-14 1972浏览量
  • 阿里云行业视觉智能诊断技术

    同样,这类问题的正常样本和故障样本都非常丰富,可以保证训练的数据量,还有一点,这类问题具有一定的容错能力,也就是说即使我们的检测出现了一些漏报现象也不会对最后的结果产生极为恶劣的影响。我们认为这样的...
    文章 2018-06-23 1634浏览量
  • 如何在ECS上搭建Oracle?Oracle云上云下6种架构全解析

    其缺点是,如果ECS出现了问题,那么数据库就会出现问题,这显然不满足期望。Oracle HA on ECS 该架构使用SLB做VIP,主库切换是对外的IP是不变的。下方是HA架构,左边部分是主节点,右边是HA节点。一般情况都是主节点...
    文章 2016-11-02 11645浏览量
  • 有货:六层混合云架构打造中国最潮生态圈

    如果没有命中,网关层调用后端服务,从服务中返回数据,在这个过程中如果服务出现故障无法访问时,网关访问二级缓存,因为二级缓存是用于容灾处理,所以二级缓存的时间非常长,数据保存24小时。图六 服务层 服务...
    文章 2016-03-31 14151浏览量
  • 数据智能遇上工业制造

    可以看到涉及图片识别检测识别,项目结果如图所示,大家可以看到,我们的故障识别率现在能做到96%左右,一般故障是指不会引起事故的,现在漏检率已经很低了,为什么会引起事故性的故障,而引起事故的故障数据样本...
    文章 2017-04-17 4375浏览量
  • 数据智能遇上工业制造

    可以看到涉及图片识别检测识别,项目结果如图所示,大家可以看到,我们的故障识别率现在能做到96%左右,一般故障是指不会引起事故的,现在漏检率已经很低了,为什么会引起事故性的故障,而引起事故的故障数据样本...
    文章 2019-09-18 1178浏览量
  • AeroSpike踩坑手记1:Architecture of a Real Time ...

    就先从Aerospike 公司在16年数据库顶 VLDB的一篇论文《Aerospike:Architecture of a Real Time Operational DBMS》展开,来高屋建瓴的审视一下 Aeropike 的设计思路,来看看如何Aerospike这款分布式数据库有什么...
    文章 2019-01-20 1686浏览量
  • 云原生背景下故障演练体系建设的思考与实践—云原生...

    故障演练一般会开始在金丝雀环境引入&xff0c;可以在全链路、无真实流量的环境中做一些高可用能力的建设和验收&xff0c;常态执行的演练&xff0c;在这个环境演练多次的场景&xff0c;可定期在灰度环境和生产环境中、控制爆炸...
    文章 2022-01-09 386浏览量
  • 分分钟拯救监控知识体系

    但是如果一般业务出现了严重故障,我们通常根据故障的级别,故障的业务,来指派不同的运维人员进行处理。当然不同业务形态、不同架构、不同服务可能采用的方式都不同,这个没有一个固定的模式套用。8 面试监控 在运...
    文章 2017-11-12 2202浏览量
  • 互联网公司面试经常问的Redis题目

    (知识点较多,我整理了个思维导图,后台回复redis,发送给你)介绍:Redis 是一个开源的使用 ANSI C 语言编写、遵守 BSD 协议、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,并提供多种语言的 API的非...
    文章 2018-10-17 1357浏览量
  • 拨云见日—深入解析Oracle TX 行锁(上)

    深度分析:数据什么会分布不均?经过跟业务部沟通,发现: 每次用户申请凭证,表内就记录一条凭证信息。如果用户反复申请,表内对同一手机号就记录多条信息。问题为何产生?一次就将表内一个手机号对应的所有...
    文章 2017-12-04 2127浏览量
  • 拨云见日—深入解析Oracle TX 行锁(上)

    深度分析:数据什么会分布不均?经过跟业务部沟通,发现: 每次用户申请凭证,表内就记录一条凭证信息。如果用户反复申请,表内对同一手机号就记录多条信息。问题为何产生?一次就将表内一个手机号对应的所有...
    文章 2017-12-01 7698浏览量
  • 还不知道如何实践微服务的Java程序员,这遍文章千万...

    事实上,在大访问量的生产场景下,故障总是会出现的。服务数量非常多,部署、管理的工作量很大。开发方面:如何保证各个服务在持续开发的情况下仍然保持协同合作。测试方面:服务拆分后,几乎所有功能都会涉及多个...
    文章 2019-08-27 1474浏览量
  • 阿里云自研数据仓库 AnalyticDB 再捧 TPC 全球冠军

    数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦数据被修改,其实就涉嫌数据造假,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,...
    文章 2020-05-14 881浏览量
  • 首度公开!OceanBase存储系统架构的演进历程及工程...

    一般情况下,OceanBase 0.5版本的部署模式是三副本,当有一个副本出现问题时,另外两个副本补齐日志并重新选出一个主提供服务,我们可以做到单点故障下不丢失任何数据,同时故障恢复时间小于30s。同时为了更好地...
    文章 2019-11-25 3382浏览量
  • 5W1H(六何分析法)全景洞察大数据

    在线实时数据清洗,一般是用sparkstreaming或者strom/jstorm直接处理实时流过来的数据,清洗完成,因为实时化,所以一般会接到在线的数据存储上,比如rds、mogodb、redis、hbase等。数据存储服务 基本来讲,hadoop...
    文章 2018-11-05 2252浏览量
  • 分布式主动感知在智能运维中的实践

    但这样处理,下次可能还会出现同样的问题。如果将故障放到ITSM部分进行分析,就能让问题得到更根本的解决。发现故障后,通过请求管理把这件事告诉后台人员,后台人员看到请求后将故障升级为“事件”并提交给研发人员...
    文章 2019-07-09 2374浏览量
  • 5W1H(六何分析法)全景洞察大数据

    在线实时数据清洗,一般是用sparkstreaming或者strom/jstorm直接处理实时流过来的数据,清洗完成,因为实时化,所以一般会接到在线的数据存储上,比如rds、mogodb、redis、hbase等。数据存储服务基本来讲,hadoop...
    文章 2016-06-30 10339浏览量
  • 阿里云弹性计算研发团队如何从0到1自建SRE体系

    可参考以下思路:在设计阶段时定义该依赖的性质,是强依赖还是弱依赖对方提供的SLO/SLA是什么,依赖方可能会出现什么问题以及对我们服务的影响是什么?如果依赖方出现了预期/非预期的异常,我们的策略是什么?如何...
    文章 2021-06-08 904浏览量
  • 带你读《智能制造之卓越设备管理与运维实践》之三:运...

    其次是管理体系,即团队以什么方式推动事情的运转、依托什么样的流程等,固化人在考虑问题和做事情时系统化的思维和方式。备件资源。如果将维修人员比作大厨,备件就相当于粮食和蔬菜。俗话讲:巧妇难为无米之炊。...
    文章 2019-11-08 1891浏览量
  • 阿里云栖开发者沙龙PHP技术专场-聊聊服务稳定性保障...

    所以要在应用服务器上做监控才报警具体哪台机器哪个服务出现故障等信息。自研监控系统下图是阿里自研的监控系统。首先确定对哪些指标进行监控。将整个指标的数据绘制出来,查看指标数据波动。一旦遇到问题,可以很...
    文章 2019-04-25 2725浏览量
  • 双11媒体大屏背后的数据技术与产品

    当时所有人都有一种非常崩溃的感觉,所幸的是那年的直播过程中数据媒体大屏并没有出现什么太大问题。但是一些的服务于商家的数据产品,比如生意参谋,还有服务于小二的阿里直播厅等数据产品因为巨大的流量出现了延迟...
    文章 2016-12-08 4334浏览量
  • 基于MaxCompute的数仓数据质量管理

    随着业务的发展,业务数据库(MaxCompute数仓的数据源)不可避免会出现数据库扩容或者DDL变更,这些变更都要主动通知到离线开发人员。基于MaxCompute的数据仓库在进行离线数据抽取时,通过DataWorks的数据集成工具,...
    文章 2019-04-11 3157浏览量
  • 什么样的云数据库架构选型才能做到安全,稳定又可靠?

    刚刚接触数据库的同学可能不太了解可维护时间这个概念,其实可维护时间和之前提到的链路是紧密相关的,通常情况下即使自己搭建数据库,也会出现数据库损坏、升级、重启或者网络需要进行变更的时候,这个时候连接一定...
    文章 2017-05-19 5163浏览量
  • 什么不建议把数据库部署在docker容器内?

    那么多个docker最终IO请求又会出现在存储上面。现在互联网的数据库多是share nothing的架构&xff0c;可能这也是不考虑迁移到 Docker 的一个因素吧”。针对性能问题有些同学可能也有相对应的方案来解决&xff1a;(1)数据库...
    文章 2021-12-30 74浏览量
1 2 3 4 ... 21 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化