• 对系统故障处理的思考

    5.通过查找上面时间点的系统故障日志,基本看到相关的错误信息的,如调用了那个数据库对象、返回了什么oracle的错误、写了什么java异常信息;如果没找到或者几百M的日志不好找,那只能模拟测试看故障能否再重现,...
    文章 2017-11-14 922浏览量
  • 有钱不当冤大头 浅析数据中心如何更节能

    一般数据中心的温度设置在68华氏度或者更低的数值左右,那么如果我们在可控范围内调整数据中心内部的温度,将数据中心内部的温度调高,那么在逻辑上就有可能延长内部设备的使用寿命,同时也能够让制冷设备在发生...
    文章 2017-07-03 1055浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    在磁盘进入SLOW或WARNING状态时,在线应用一般会选择不再使用此磁盘,因为此时磁盘可能已经出现损坏的迹象,会造成延时大规模增加,但对于理想的应用则可以继续使用。一旦磁盘进入ERROR状态,则表明此磁盘可能马上...
    文章 2016-12-18 4655浏览量
  • 架构设计之「数据库从主备到主主的高可用方案」

    并且在「主机」出现故障时,在人工介入之前,好歹「从机」也是能够提供数据的「读」操作的,毕竟大多数业务都是「读」多「写」少,因此对稳定性又提高了一个层次。缺点就是架构稍微复杂了一点,毕竟「主机」和「从机...
    文章 2018-09-30 4118浏览量
  • MySQL数据库备份与恢复

    所谓的逻辑备份就是将数据库定义语言和所有的数据转换成SQL文件存储,一般有mysqldump等方式,这种方式比较适合小数据量的库和表,当数据量达到一定量后,备份、恢复时间长,同时在备份过程中锁表,影响比较大。...
    文章 2017-11-27 1206浏览量
  • 将视觉深度学习模型应用于非视觉领域

    这个时候,通常邀请专业的技术人员过来检查卡片,并根据抽油机出现故障的部分来判断需要采取什么措施和方法来进行维修。这个过程不仅非常耗时,而且还需要非常深入的专业知识才能有效地解决问题。另一方面,这个...
    文章 2019-01-29 1478浏览量
  • 利用SQL SERVER 2005数据库镜像实现可用性

    那么假如说由于某种原因,我们的主服务器或是主数据库不可用了,例如,网络中断,系统故障等等,那么客户端重新定向到镜像服务器,那么客户端仍然能读取数据,写入数据,他感觉不到主数据库服务已经宕机了。...
    文章 2017-11-14 1033浏览量
  • SQL优化案例(1):隐式转换

    前面的两种场景都是操作符两侧数据类型不同的情况,事实上,数据类型相同也可能会出现隐式转换,比如下面这个字符集不一致导致隐式转换的例子: 1)待优化场景 SQL及执行计划如下: SELECT COUNT(*) FROM `t1` o join...
    文章 2020-10-22 166浏览量
  • heartbeat基础知识

    心跳消息为约150字节的数据包,可能为单播,广播或者多播的方式,控制心跳频率以及出现故障要等待多久进行故障转换 2)集群转换消息 当主服务器恢复在线状态时,通过ip-request消息是要求备机释放主服务器失败时被...
    文章 2017-11-27 938浏览量
  • Facebook TSDB论文翻译

    大型互联网服务一般出现故障及时响应和保持高可用性为目标。为了提供正常稳定的服务,通常要每秒从大量系统中监控和分析数以千万计的数据(性能数据和业务数据)。一个特别高效的解决方案是用TSDB对这些数据进行...
    文章 2017-08-18 2134浏览量
  • Hadoop HDFS概念学习系列之HDFS Block(八)

    然后,客户端把文件名和Block索引发送给Master节点,Master节点将相应的Block标识和副本的位置信息返回给客户端,客户端用文件名和Block索引作为key缓存这些信息,之后客户端发送请求到其中的一个副本,一般会选择...
    文章 2017-11-21 1158浏览量
  • 数据平台架构设计探究

    ETL通过和元数据平台打通,规范Schema定义,然后将数据转换、分流流入到实时与离线计算平台,后续任何针对该数据离线和实时处理,只需要申请元数据表权限就可以开发任务完成计算。数据采集支持多种各式数据来源,...
    文章 2019-12-23 3317浏览量
  • Apache Flink 漫谈系列(02)-概述

    出现某些指定的网络故障、硬件故障、软件错误时,系统仍能执行规定的一组程序,或者说程序不会因系统中的故障而中止,并且执行结果也不会因系统故障而引起计算差错。容错的处理模式 在一个分布式系统中由于单个...
    文章 2018-11-08 10212浏览量
  • 这些常见的网络故障,你都知道如何解决吗

    一般情况下,网卡出现故障的可能性比较小,因此将重点放在对集线器的排除方面。故障解决 更换集线器,网络恢复正常。故障 4:升级至千兆网络之后,服务器连接时断时续 故障现象 原先服务器采用10/100Mbit/s网卡,...
    文章 2018-10-25 1397浏览量
  • Greenplum在企业生产中的最佳实践(下)

    另外,要看一下是什么故障导致的,要简单的分析一下。另外,你做成这种全自动的方式是很容易的,自动化脚本切换是很容易的,但是前面还是有一些判断的动作,我们也有客户把这个判断和切换的逻辑封装在一起,做成...
    文章 2017-08-02 3071浏览量
  • Spark项目故障总结

    2、看log log一般会报是在你的哪一行代码,导致了OOM异常;或者呢,看log,看看是执行到了第几个stage!我们这里不会去剖析stage的划分算法 方案一:聚合源数据 将导致数据倾斜的一些shuffle操作,比如,groupbykey,...
    文章 2017-11-08 1058浏览量
  • LinkedIn 开源其分布式对象存储系统 Ambry

    恢复:因为系统和机器会出现宕机,磁盘上的数据也有可能会损坏,所以有必要实现恢复(recovery)的功能。在启动的时候,存储层会从最后一个已知的检查点读取log,并重建索引。恢复也有助于重建内存中的状态。Log是...
    文章 2017-07-03 1928浏览量
  • 万亿级数据洪峰下的分布式消息引擎

    对于前者,通过运维管控系统推送应用自身QoS数据一般会输出如下表格。而引擎组件的服务QoS,如服务于消息问题追溯的链路轨迹组件,对于核心功能来说,定级相对较低,可在洪峰到来之前提前关闭。谈到熔断,不得不提...
    文章 2017-02-07 7031浏览量
  • Apache Flink 零基础入门教程(六):状态管理及容错...

    如果要做 24 小时的窗口计算,将 24 小时的数据都放到内存,可能会出现内存不足;另外,作业是 7*24,需要保障高可用,机器若出现故障或者宕机,需要考虑如何备份及从备份中去恢复,保证运行的作业不受影响;此外,...
    文章 2019-08-05 930浏览量
  • Apache Flink 零基础入门教程(六):状态管理及容错...

    如果要做 24 小时的窗口计算,将 24 小时的数据都放到内存,可能会出现内存不足;另外,作业是 7*24,需要保障高可用,机器若出现故障或者宕机,需要考虑如何备份及从备份中去恢复,保证运行的作业不受影响;此外,...
    文章 2019-08-05 4966浏览量
  • TCP状态转换

    什么情况下会出现此种情况呢?其实细想一下,也不难得出结论:那就是如果双方几乎在同时close一个SOCKET的话,那么就出现了双方同时发送FIN报文的情况,也即会出现CLOSING状态,表示双方都正在关闭SOCKET连接。CLOSE...
    文章 2012-02-18 732浏览量
  • TCP状态转换

    什么情况下会出现此种情况呢?其实细想一下,也不难得出结论:那就是如果双方几乎在同时close一个SOCKET的话,那么就出现了双方同时发送FIN报文的情况,也即会出现CLOSING状态,表示双方都正在关闭SOCKET连接。CLOSE...
    文章 2012-02-18 637浏览量
  • 【双11背后的技术】万亿级数据洪峰下的分布式消息引擎

    对于前者,通过运维管控系统推送应用自身QoS数据一般会输出如下表格。而引擎组件的服务QoS,如服务于消息问题追溯的链路轨迹组件,对于核心功能来说,定级相对较低,可在洪峰到来之前提前关闭。谈到熔断,不得不提...
    文章 2017-01-12 5706浏览量
  • 我明明 immediate 关库的,怎么就打不开了?

    看到最后,或许大家会觉得很奇怪,为什么会出现这样的故障呢?这里我也跟大家一样困惑。这库是通过shutdown immediate方式正常停止的。我们都知道,这种方式停库之后,整个Oracle数据库的文件都是处于一致的状态,...
    文章 2017-07-17 1360浏览量
  • 托管节点池助力用户构建稳定自愈的 Kubernetes 集群

    一般业务影响的来源主要有几个方面,应用被重启后已有连接被迫中断,应用重启中间状态可能丢失,应用迁移时未保存的临时数据丢失等。因此需要应用在设计上能够容忍重启,具备响应驱逐信号的能力。从另一个角度来说...
    文章 2021-02-02 3178浏览量
  • 带你读《数据库与数据处理:Access 2010 实现 第2版》...

    对于关系数据库来说,系统自动地将用户设计好的数据库全局模式转换为相应的内模式,用户只需要考虑是否建立索引、使用什么方式的索引等问题,有的DBMS提供一些物理优化的选择,如内存缓冲区的大小及个数、建立...
    文章 2019-11-11 360浏览量
  • Linux系统的中断、系统调用和调度概述【转】

    中断一般分为三类:1、由计算机硬件异常或故障引起的中断,称为内部异常中断;2、由程序中执行了引起中断的指令而造成的中断,称为软中断(这也是和我们将要说明的系统调用相关的中断);3、由外部设备请求引起的...
    文章 2017-11-14 936浏览量
  • 服务器托管到机房有什么好处?

    但是办公室一般使用的都是动态IP,而且需要经过一层层的转换,完完全全跟不上全国各地的访问速度。机房要求高 服务器需要在一个稳定的环境下运行,温度、湿度、防尘等方面都需要引起注意,而只要建立专业的机房才...
    文章 2017-07-08 1133浏览量
  • Greenplum在企业生产中的最佳实践(上)

    对于底下的数据节点,就GP数据库来说,一般会做海量数据的处理和分析,因此数据节点往往需要承担大量的数据存储和计算。建议对于计算节点一般采用2U的服务器,可以采用24块600GB或者900GB的SAS 10K或者15K转的盘,...
    文章 2017-07-29 4679浏览量
  • 周轶璐教授:服务好医生,如何更全面地了解数据、利用...

    经过数据分析和挖掘,可以预估这台设备有可能出现故障的部件、时间等规律,实现从事后维修到事前预警监测的突破。同时将互联网、云计算、大数据应用到医疗设备的管理中,指导制定医疗设备购置、档案处理等方方面面,...
    文章 2017-10-25 839浏览量
1 2 3 4 ... 14 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化