• 找到 OSChina 早上 8 点钟容易宕机的原因

    我记得当初这么设置的原因是有一个索引的构建容易出问题,为了避免出问题时没人处理,因此设置了这个时间段,后来一直没去调整。再查看系统跑 lucene 的进程,我靠,那么那么那么多。赶紧一个 killall java 杀掉所有...
    文章 2016-08-29 926浏览量
  • 怎样管理Lotus Domino

    系统宕机不能及时定位故障原因。维护经验不能自动汇总分发。…… 针对这些常见问题:·问题1-系统维护门槛高 对Lotus Domino系统进行维护的人员,需要较高的技术水平和丰富的维护经验,这样就造成了只有少数人具有...
    文章 2017-11-09 2076浏览量
  • 基于Web应用的性能分析及优化案例

    优化程序中的SQL语句,增加where子句上的匹配条件,减少遍历全部的查询,同时在where和order by子句的字段上建立索引,并且增加程序缓存机制,通过这次优化,网站运行基本处于正常状态,再也没有出现宕机的现象。...
    文章 2017-11-08 1276浏览量
  • Apache Flink 在快手的过去、现在和未来

    宕机快速发现方面,我们研发了 Hawk Service,它是一个多数派的连通性检测服务,具体的检测流程是 Hawk 集群中多个工作节点会周期性地检测集群中每台机器的连通性,由于它是多数派的,所以可信度是有保障的。...
    文章 2021-02-26 1032浏览量
  • RMQ——支持合并和优先级的消息队列

    正常情况下,消费者不管消费失败还是消费成功,都会从PrepareQueue删除消息,当消费者系统发生异常或者宕机的时候,消息就无法从PrepareQueue中删除,我们也不知道消费者是否消费成功,为保障消息至少被消费一次,...
    文章 2020-12-21 383浏览量
  • Windows Azure Traffic Manager(1)Windows Azure ...

    万一微软的某个数据中心因为不可抗的原因(战争、地震等),造成该区域内数据中心的服务宕机,势必会影响XYZ公司的业务造成影响。Windows Azure Traffic Manager可以解决这样的问题:一旦在某个数据中心的托管服务宕机...
    文章 2017-04-30 870浏览量
  • 今日说法和现身说法

    这是不是造成整个宕机的原因呢,要说是还是很牵强,因为很多应用中1000个连接其实还是很正常的。那么问题出在哪里,如果是连接数的问题,为什么再早几天就没问题。 这种问题我相信我自己也会问自己,怎么能够解释得...
    文章 2017-08-06 1147浏览量
  • 高可用笔记(2)redis

    ODOWN,即objectively down,当sentinel认为mymaster主观宕机(SDOWN)时,会发起一个投票,之后当多数sentinel判断mymaster已经宕机时,才会得出结果ODOWN。那么这里判断mymaster ODOWN时就必须有两台sentinel投...
    文章 2017-01-11 2149浏览量
  • 在云中扩展服务器的11个技巧

    新传入的流量不会到达宕机的服务器,因为负载平衡器会将新流量定向到可以处理它的服务器。场景 B:一次自然灾难袭击了整个东海岸。您的应用程序将会如何反应?如果即将出现这种情况,那么应该一切正常,因为您会在...
    文章 2017-07-04 1119浏览量
  • 服务器中加速BIOS启动的方法

    这也就是为什么现在大部分处理器都使SPI Flash取指的原因。有的CPU还支持高级的Cache的操作,能够把最近访问指令或数据的相邻指令或数据缓存到Cache中去,后面的访问都会从Cache去执行,这比从SPI Flash访问数据或者...
    文章 2017-11-23 1133浏览量
  • 《Spark大数据分析:核心概念、技术及实践》一 第1章 ...

    HDFS基于通常机器可能宕机这个假设而设计,所以可以处理集群中一台或多台机器的宕机问题。一个HDFS集群包含两种类型的节点:NameNode和DataNode(见图1-3)。Name-Node管理文件系统的命名空间,存储一个文件的所有元...
    文章 2017-05-02 1074浏览量
  • OceanBase高可用实践

    分布式系统往往采取比较廉价的硬件,其可靠性相对于小型机、专有硬件有很大的不足,而分布式系统的规模一般比较大,假如硬件的可靠性只有三个9(99.9%),一个1000台机器规模的集群每天将面临1台机器宕机的风险,...
    文章 2019-07-28 1546浏览量
  • Java经典面试题整理及答案详解(八)

    2.数据库事务未结束宕机后,重启事务回滚原理。如果是Oracle那么就是relog(重做日志),你所有的记录都在日志里完成。3.进程执行和线程执行优缺点比较。进程的执行速度慢,线程执行速度快。每当使用Java命令去启动...
    文章 2020-03-10 4197浏览量
  • RocketMQ 客户端最佳实践

    FLUSH_SLAVE_TIMEOUT,消息发送成功,但是服务器同步到Slave时超时,消息已经进入服务器队列,只有此时服务器宕机,消息才会丢失。SLAVE_NOT_AVAILABLE,消息发送成功,但是此时slave不可用,消息已经进入服务器队列...
    文章 2016-12-09 10635浏览量
  • rmq_vs_kafka

    Producer调用发送消息接口,消息未发送到Broker,向业务返回成功,此时Producer宕机,会导致消息丢失,业务出错 Producer通常为分布式系统,且每台机器都是多线程发送,我们认为线上的系统单个Producer每秒产生的...
    文章 2016-04-08 4476浏览量
  • 神不知鬼不觉,阿里程序员把地球多出的1秒“变没”了

    最常见的情况是,如果服务器操作系统是Linux,在一些老的内核版本中存在BUG无法处理闰秒,导致收到闰秒通告消息可能会宕机、插入闰秒可能会宕机、打印闰秒日志也能引发宕机。就说说红帽的老发行版,出现的“Systems ...
    文章 2017-06-20 1437浏览量
  • SR采用PubSubHubbub协议实时接收GReaderSharedItems...

    当你的 Subscriber 掉线或者宕机一段时间后(比如一小时无法连线),hub 就认为你不再续订,于是不会再 push 数据给你了。你需要重新发起所有订阅请求。3、更新速度: 并不是像通常想像的,你一在Google Reader里...
    文章 2016-04-26 1115浏览量
  • 为什么Flink会成为下一代大数据处理框架的标准?

    因此Flink较其他分布式处理的框架则会显得更加稳定,不会因为JVM GC等问题而导致整个应用宕机的问题。Save Points(保存点) 对于7*24小时运行的流式应用,数据源源不断的接入,在一段时间内应用的终止都有可能导致...
    文章 2019-09-21 1159浏览量
  • 以管理为轴心 为IT服务保驾护航——北京赛特百货有限...

    一旦该平台出现宕机或者严重性能问题,Mocha BSM将通过多种方式进行告警。以最快的速度通知相关管理人员,对该业务系统进行及时处理。全面灵活的基本资源监控 赛特百货的网络设备相对较多,大部分为交换机,同样品牌...
    文章 2017-11-15 930浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    也可能Kernel出现类似208天的问题(Linux Kernel著名的一个Bug:系统连续运行208.5天自行重启),引起机器大批量的宕机。基于以上考虑,结合华佗自我保护机制,华佗引入Quota管理和手工驾驶,即当故障率超过华佗预设...
    文章 2016-12-18 4655浏览量
  • MySQL Innodb日志机制深入分析

    Innodb的数据并不是实时写盘的,为了避免宕机时数据丢失,保证数据的ACID属性,Innodb至少要保证数据对应的日志不能丢失。对于不同的情况,Innodb采取不同的对策: l 宕机导致日志丢失Innodb有日志刷盘机制,可以...
    文章 2011-06-25 1904浏览量
  • 技术篇-深入解读 HBase2.0 新功能之 ...

    假设,一台 server 宕机,此时 master 会产生一个ServerCrashProcedure 来处理,在这个 Procedure 中,会做一系列的工作,比如 WAL 的 restore。当这些前置的工作做完后,就会开始 assign 之前在宕掉服务器 上 的 ...
    文章 2019-01-10 1745浏览量
  • Apache RocketMQ QuickStart

    另外Kafka的Replication以topic为单位,支持主机宕机,备机自动切换,但是这里有个问题,由于是异步Replication,那么切换后会有数据丢失,同时Leader如果重启后,会与已经存在的Leader产生数据冲突。开源版本的...
    文章 2017-09-29 2314浏览量
  • 关于分布式计算的一些概念

    系统几乎不会宕机(高可用性 99.9999999%一年只有 31 ms 宕机)。Akka虽然是Scala写成的,但是由于Scala最终还是编译为Java字节码运行在JVM上,所以我们可以认为Akka属于Java领域。Akka处理并发的方法基于Actor模型。...
    文章 2018-06-03 4096浏览量
  • Mocha BSM产品亮点——自定义事件

    在IT运维流程当中,往往IT管理员不仅只靠宕机事件或者指标事件来触发工单。IT管理员需要事件不同的组合,比如: 如果CPU和内存利用率超标了,给IT管理员A下派工单处理 如果某个文件目录增长速度过快和硬盘利用率超标...
    文章 2017-11-10 723浏览量
  • 钉钉成功案例分析

    如果托管您的网站或应用的物理服务器遇到宕机,不需要您做任何事情,云计算会将您的网站或应用迁移到另一台正常运作的服务器上,使您免除损失。弹性当您面临突然的流量激增时,您可能需要更多资源来帮助您处理对应用...
    文章 2020-12-02 1461浏览量
  • 流量激增不宕机,服务限流系统架构解密

    但除了队列以外,还要设置一个令牌桶,另外有一个脚本以持续恒定的速度往令牌桶里面放令牌,后端处理程序每处理一个请求就必须从桶里拿出一个令牌,如果令牌拿完了,那就不能处理请求了。我们可以控制脚本放令牌的...
    文章 2018-11-14 1663浏览量
  • 云计算与钉钉相结合——钉钉成功案例分析

    如果托管您的网站或应用的物理服务器遇到宕机,不需要您做任何事情,云计算会将您的网站或应用迁移到另一台正常运作的服务器上,使您免除损失。弹性 当您面临突然的流量激增时,您可能需要更多资源来帮助您处理对...
    文章 2020-09-28 912浏览量
  • [Java]如何提高Web服务端并发效率的异步编程技术?

    Nginx,PHP的并发处理都用到这种机制的原理,特别是现在很火的Node.js它产生的原因就是依靠这种非阻塞的技术来编写更高效的Web服务器,可以说Node.js把这种技术用到了极致,不过这里要纠正下,非阻塞是针对IO操作的...
    文章 2014-09-05 1827浏览量
  • 云计算与钉钉相结合——钉钉成功案例分析

    如果托管您的网站或应用的物理服务器遇到宕机,不需要您做任何事情,云计算会将您的网站或应用迁移到另一台正常运作的服务器上,使您免除损失。弹性 当您面临突然的流量激增时,您可能需要更多资源来帮助您处理对...
    文章 2020-09-28 349浏览量
1 2 3 4 ... 11 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化