• 生产环境JVM内存溢出案例分析

    发生内存泄露,通常情况下是由于代码的原因造成的,一般无法立即对代码进行修复,很容易会发送连锁反应造成应用服务器一台一台接连宕机,故障面积会慢慢扩大,针对此种情况,应快速定位发生内存泄露的原因,将该服务...
    文章 2019-03-27 2325浏览量
  • System Center Operations Manager 2012 SP1 处理“未...

    我们知道一个管理包中包含了对象类,监视器,规则,视图任务等等元素。例如,我们需要监控DNS服务器,那么管理包中就必须描述清楚DNS的样子,如何监视,收集数据的规则等等。SCOM监控一个对象,首先它得找得到这个...
    文章 2017-11-14 1188浏览量
  • 带你读《企业数据湖》之三:Lambda架构:一种数据湖...

    3.4.3 服务层服务层的核心任务是响应查询,将批处理层和快速处理层创建的视图展示给用户或其他系统。除此之外,这一层还有很多精细的工作需要进行。快速处理层需要一直关注批处理层,以观察是否完成了必要的批处理...
    文章 2019-10-20 2628浏览量
  • 大数据架构如何做到流批一体?

    这也是当下许多企业,在大数据上深耕的原因。大数据分析场景需要解决哪些技术挑战?目前,有哪些主流大数据架构模式及其发展?今天,我们都会一一解读,并介绍如何结合云上存储、计算组件,实现更优的通用大数据架构...
    文章 2019-07-01 4972浏览量
  • 阿里巴巴DevOps实践指南(二十一)|全景监控

    因此开发运维人员可以在一个监控界面上逐步排除故障发生时的可疑点,快速定界到故障发生的原因。这里以某订单系统调用延时突增故障为例,介绍一下全景监控的故障排查过程:线上问题发生的第一时间,负责该订单系统的...
    文章 2021-07-06 239浏览量
  • 分布式与集群的区别

    错误恢复-由于某种原因,执行某个任务的资源出现故障,另一服务实体中执行同一任务的资源接着完成任务。这种由于一个实体中的资源不能工作,另一个实体中的资源透明的继续完成任务的过程叫错误恢复。负载均衡和错误...
    文章 2016-05-14 4368浏览量
  • 快速定位 摆脱运维所累

    技术型IT运维所面临的困境 网络的高可用性越来越重要,当业务系统不能正常工作时,有可能是网络线路问题造成的,但也有可能是由于其他系统资源的问题造成的,为了准确地分析故障原因,必须要在网络管理方面需要更...
    文章 2017-11-25 932浏览量
  • Oracle 白皮书-Oracle Data Guard 快速启动故障切换...

    虽然重做传输是同步的,但如果备用数据库由于某种原因(如备用数据库、主机或网络故障)不可用,最高可用性模式会保持主数据库可用。如果在用户指定的时间段(log_archive_dest_n 的 NET_TIMEOUT 选项)之后,主...
    文章 2017-11-08 1181浏览量
  • 托管节点池助力用户构建稳定自愈的 Kubernetes 集群

    所以我们说自愈难度大,原因在于我们无法事先穷举所有可能的故障,也就无法完全覆盖故障解法。并且维护复杂多样的自愈方案对人类的脑容量来讲将会是灾难。千奇百怪的故障总会突破任何一个人脑容量的上限。2.第二阶段...
    文章 2021-02-02 3180浏览量
  • 分布式与集群的联系与区别

    错误恢复-由于某种原因,执行某个任务的资源出现故障,另一服务实体中执行同一任务的资源接着完成任务。这种由于一个实体中的资源不能工作,另一个实体中的资源透明的继续完成任务的过程叫错误恢复。负载均衡和错误...
    文章 2019-08-13 808浏览量
  • 带你读《智能制造之卓越设备管理与运维实践》之三:运...

    2.预测性维修预测性维修是以设备当前的实际工作状况为依据,相比传统的以设备使用时间为依据的维修,它通过先进的状态监测与诊断手段,识别故障的早期征兆,对故障部位、故障程度和发展趋势做出判断,根据诊断结果来...
    文章 2019-11-08 1195浏览量
  • Java系统中内存泄漏测试方法的研究

    通过抽取多个实例进行引用图的分析统计以后,可以找出一条或者多条从牵引对象出发的引用链,下面的任务就是找出这条引用链形成的原因。实例分配图提供的功能是对每个类的实例的分配位置进行统计,查看实例分配的统计...
    文章 2017-12-08 963浏览量
  • 《Greenplum5.0 最佳实践》系统参数(二)

    这个参数可以用来排除故障和调优查询,注意如下视图 gp_workfile_usage_per_query 视图使用一行存储,当前时间段中,一个段数据库的一个操作的workfile所占用的磁盘空间 gp_workfile_usage_per_query 视图使用一行...
    文章 2017-10-21 2730浏览量
  • 简单实现成功的数据备份和恢复的五大要点

    一般情况下,主备份服务器上的数据只保存很短的时间,可能导致其不能够再被访问,从而使得理解和防止下一次故障失败的任务变得几乎不可能。解决方案 遵循我所推荐的最佳实践方案,谨慎的做法是从初级的和分布式备份...
    文章 2017-07-03 948浏览量
  • 带你读《思科软件定义访问:实现基于业务意图的园区...

    在 Wi-Fi网络上确定终端用户设备的实际体验一直是一项艰巨的任务。思科和苹果在此方面合作&xff0c;从苹果 iOS11开始&xff0c;DNA中心网络保障能够从支持的苹果设备中获取这些有价值的反馈&xff0c;回答如下问题。① ...
    文章 2021-10-19 1浏览量
  • AR工业|你知道BT-300除了看电影,在工业上居然还有...

    一项研究发现,正确识别关键部件和确定故障的根本原因是提高机械系统整体可靠性的两个主要组成部分。用于维护的第三种方法是在操作手册或其他指导材料(如视频)的协助下来帮助新手技术人员解决现场问题。尽管技术...
    文章 2020-05-17 211浏览量
  • 六点解读Hadoop版本和生态圈

    造成Hadoop版本混乱的原因: 主要功能在分支版本开发:0.20分支发布之后,主要功能一直在该分支上进行开发,主干分支并没有合并这个分支,0.20分支成为了主流。低版本的后发布:0.22版本发布要晚于0.23版本。版本重...
    文章 2017-09-07 1077浏览量
  • 数据库管理员的第一本书》——1.6节DBA的任务

    本节书摘来自华章社区《DBA修炼之道:数据库管理员的第一本书》一书中的第1章,第1.6节DBA的任务,作者(美)Craig S.Mullins,更多章节内容可以访问云栖社区“华章社区”公众号查看 1.6 DBA的任务DBA要能胜任多种...
    文章 2017-07-03 1121浏览量
  • Hadoop工作机制

    6.jobtracker合并各任务报告:产生一个表明所有运行作业机器所含任务状态的全局视图。前面提到的JobClient就是通过每秒查询JobTracker来接收最新状态,而且客户端JobClient的getJob方法可以得到一个RunningJob的实例...
    文章 2014-03-28 1316浏览量
  • 全面解析Oracle等待事件的分类、发现及优化

    非空闲等待事件,专门针对Oracle的活动,指数据库任务或应用运行过程中发生的等待,这些等待事件是调整数据库的时候应该关注与研究的。2)等待事件分类说明 管理类-Administrative 此类等待事件是由于DBA的管理命令...
    文章 2017-05-02 4156浏览量
  • Hadoop工作机制

    6.jobtracker合并各任务报告:产生一个表明所有运行作业机器所含任务状态的全局视图。前面提到的JobClient就是通过每秒查询JobTracker来接收最新状态,而且客户端JobClient的getJob方法可以得到一个RunningJob的实例...
    文章 2014-03-28 1257浏览量
  • 一种基于Lucene的实时搜索服务

    所以基于上述原因我们的搜索平台实现一个分布式全量索引任务调度框架来解决搜索业务全量索引构建的问题。图1-6如图1-6 DUMP中心架构图所示简单描述下一个业务全量索引构建的流程:将一个具体业务相关的上下文信息...
    文章 2018-01-26 5344浏览量
  • [翻译]SQL Server等待事件—...

    可能有多种原因导致工作线程发生饥饿现象(Worker thread starvation),包括下面一些情况:·一个线程获取了一个锁,然后导致其它线程被阻塞,越来越多的连接出现并被阻塞,最终耗尽了线程池(thread pool)中的...
    文章 2018-08-03 830浏览量
  • 《需求设计:构建用户想要和需要的产品》——2.2 ...

    在绘制任务层面的视图时,应该把任务之间的数据分享及消息传递情况画出来,这通常有助于我们更好地理解该流程。任务之间的依赖关系不仅仅是流程而引发的。如果需要分配资源(如要指定送货用的车辆),那么也需要指定...
    文章 2017-05-02 1012浏览量
  • Oracle 白皮书-Oracle Data Guard 快速启动故障切换...

    监视主数据库和备用数据库上的警报日志是在监视 Broker 运行和熟悉其如何执行各种任务的好方法。enable configuration;验证配置 在继续前确保一切正常运行。show configuration Configuration Name: FSF Enabled:...
    文章 2017-11-15 1019浏览量
  • CDP中的Hive3系列之Hive3使用指南

    查询缓存·物化视图&xff0c;但以受限的方式除外·自动运行时过滤·插入后合并文件在外部表上运行DROP TABLE时&xff0c;默认情况下&xff0c;Hive仅删除元数据&xff08;Schema&xff09;如果您希望DROP TABLE命令也删除外部表中...
    文章 2021-08-10 74浏览量
  • CDP中Apache Hive3使用指南

    查询缓存·物化视图&xff0c;但以受限的方式除外·自动运行时过滤·插入后合并文件在外部表上运行DROP TABLE时&xff0c;默认情况下&xff0c;Hive仅删除元数据&xff08;Schema&xff09;如果您希望DROP TABLE命令也删除外部表中...
    文章 2021-08-10 23浏览量
  • 数据库运维工具化:一切从“简”,只为DBA更轻松

    从Oracle 数据库 10g开始增加V$ACTIVE_SESSION_HISTORY视图,通过它可以容易地得知当前Instance的活动状态,主要是知道各个时刻系统都在等待哪些事件,通过对这些等待事件和相应等待次数的统计,就可以清晰地了解...
    文章 2017-05-02 1427浏览量
  • 数据开发(DataStudio)降本提效的核心利器|《一站式...

    右侧视图就能看到任务运行的整体日志并且进行运行的诊断。实际上&xff0c;运行诊断功能是从依赖检查开始的。首先检查任务的上游依赖的所有任务是不是已经运行完成了&xff0c;如果都运行完成了&xff0c;再检查当前这个任务...
    文章 2021-07-27 248浏览量
  • 《Greenplum5.0 最佳实践》系统监控与维护(五)

    可以用来确定硬件故障,它的性能检查涉及到如下几条: 磁盘 I/O检测-使用的是 linux 系统命令 dd 读写大的日志文件,来获得磁盘的性能。他返回结果为 读写 MB/sec 内存带宽测试-是使用的是 STREAM benchmark 来测试...
    文章 2017-11-03 2095浏览量
1 2 3 4 ... 7 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化