• 黑客与宕机

    对于这个问题来说,宕机的直接原因是"Kernel panic-not syncing:stack-protector:Kernel stack is corrupted in:ffffxxxxxxxx87eb",如图 2 所示。图2 关于这条信息,我们必须逐字解读。Kernel panic-not syncing:...
    文章 2020-07-17 792浏览量
  • 五分钟学后端技术:分布式系统理论-从放弃到入门

    宕机的participant恢复后发现收到precommit或已经发出赞成vote,则自行commit该次事务 阶段3:即便coordinator或watchdog未收到宕机participant的commit ACK,也结束该次事务;宕机的participant恢复后发现收到commit...
    文章 2020-03-23 1014浏览量
  • vmcore自动分析工具

    提取vmcore中宕机原因的特征,从而实现后续对大量的vmcore文件进行相似度分析,识别相同问题的vmcore的目标。3)考虑是否可以将机器学习引入到vmcore;将机器学习用于提取vmcore特征、训练vmcore特征匹配模型可能是...
    文章 2019-09-29 2535浏览量
  • 《函数式编程入门:使用 Elixir》译者序

    Elixir 选择将其基座造在 BEAM(Erlang VM)之上,BEAM 以 9 个 9 的可用性(31 毫秒/年的宕机时间)而著称。从并发上看,Actor 模型曾经是 Erlang 的优势之一,但今天 Rust 的 Actix 和 Java 的 Vert.x 性能测评...
    文章 2020-07-08 403浏览量
  • 云栖大讲堂Java基础入门(三)-阿里巴巴Java开发手册...

    有的时候,在整个一个大的公司内部,希望大家的工程结果能够统一,这样的话大家在阅读别人的代码,或者说复用别人的代码的时候会非常的直观和方便,这时候可以参考工程规约;最后一个设计规约,指在设计软件,设计...
    文章 2018-05-03 5251浏览量
  • 高德算法工程一体化实践和思考

    如果简单的把这些扔给算法同学,就仅是工作量的转移,并且还可能引起整个业务的宕机风险。因此,质量保障体系建设就变成了重要的一环。质量保障体系建设很多人会认为,要做质量保障,就是提交到测试人员进行测试或...
    文章 2020-02-27 1109浏览量
  • 应用运维——《应用智能运维实践(试读版)》

    系统故障和宕机频率快速升高&xff0c;人工运维成本飙升。著名管理咨询公司麦肯锡在名为Measuring the Net’s Growth Dividend的分析报告中指出&xff0c;2013—2025年&xff0c;互联网将帮助中国的GDP增长率提升0.3&xff5e;1....
    文章 2021-07-06 352浏览量
  • 服务要曲中求全

    于是,就有了服务器宕机后焦急而漫长的等待,就有了交换机罢工时四处的电话寻找。针对这样的情况,厂商在自己的产品销售过程中纷纷推出了类似“金牌服务”、“超级服务”等相关的可选择捆绑销售服务,使得用户用非常...
    文章 2017-11-13 742浏览量
  • 低成本和高性能MySQL云数据的架构探索

    Proxy服务器是无状态的,服务器宕机不会对系统中其他服务器造成影响,只会造成连接到该proxy的用户连接断开。多台Proxy服务器采用LVS HA方案实现负载均衡,用户应用重连后会被LVS定向到其他的proxy上。Agent服务器...
    文章 2012-12-04 1679浏览量
  • 我们做出了一个分布式注册中心

    这样依赖,数据迁移的粒度只能以单个data节点所存储的数据为单位,在数据量较大(单节点8G)的情况下,对数据的重建有一定的影响,而且,在data连续宕机的情况下,可能存在数据丢失或是不一致的场景。改进后的算法,...
    文章 2021-07-27 146浏览量
  • Kubernetes是否存在“杀敌一千,自损八百”的问题?

    但这正是问题所在:并非所有的基础架构都需要进行由数十到数千的大规模节点扩展(但是,大家至少需要两个节点,从而尽可能降低宕机事故的可能性)。千万别被扩展性所误导——Kubernetes的优势绝不仅限于扩展性。对于...
    文章 2017-10-11 1313浏览量
  • 知乎技术分享:从单机到2000万QPS并发的Redis高性能...

    5)Sentinel 切换功能主要依赖 down-after-milliseconds 和 failover-timeout 两个参数,down-after-milliseconds 决定了 Sentinel 判断 Redis 节点宕机的超时,知乎使用 30000 作为阈值。而 failover-timeout 则...
    文章 2018-09-18 3015浏览量
  • 【Java开发者专场】阿里特邀专家徐雷:Java为王,...

    另外要注意,在做数据采集时,每个数据节点都是集群架构模式,如果机器宕机,数据会直接丢失,无法恢复。所以在技术路线选型上推荐下图中的方案,基于Open JDK和Java Spring Cloud这套路线。综合来讲,Java架构是最...
    文章 2018-12-27 3148浏览量
  • 《架构师》反思:系统可靠性

    但是可能会导致“单点错”,即系统中某一部件或某个应用程序发生故障时,导致所有系统全部宕机。如磁盘阵列如果出错,可能会导致存储的数据全部丢失。特点:性能较高、可能导致单点错误。(3)光纤通道双机双控集群...
    文章 2016-05-05 4890浏览量
  • Uber是如何使用MySQL设计可扩展性数据存储的?

    如果凌晨3点我们接到叫车请求,但是这时数据存储无法响应查询,导致业务宕机,我们是否有相关操作知识可以快速解决这个问题。鉴于以上种种,我们分析了几种常用的选择的优势和潜在的限制,比如Cassandra、Riak、...
    文章 2017-05-02 1870浏览量
  • Java专家推荐之问题终结者杜万,新手学习servlet、jsp...

    我的web应用经常被爬虫数据,导致宕机,有没有什么好的反爬手段?随着go的新起,java的未来可见吗?使用SpringBoot搭建框架到底选Hibernate还是Mybatis?时至今年「2018」,如果是新建立的小型项目(初期并发在500...
    文章 2018-11-20 1581浏览量
  • 请讲」小i机器人朱频频:会话AI将成为主流人交流...

    “行业还是存在一些问题的,例如机器人会在行走的过程中因路径规划不精确、地上有障碍物、被人故意挡住等而卡停在原地,或者在会话时遇到‘超纲’的问题而‘宕机’,但这些都是不要紧的,而且还有很多好处。...
    文章 2018-03-01 771浏览量
  • 请讲」小i机器人朱频频:会话AI将成为主流人交流...

    “行业还是存在一些问题的,例如机器人会在行走的过程中因路径规划不精确、地上有障碍物、被人故意挡住等而卡停在原地,或者在会话时遇到‘超纲’的问题而‘宕机’,但这些都是不要紧的,而且还有很多好处。...
    文章 2018-03-06 1002浏览量
  • 大促场景系统稳定性保障实践经验总结

    江煵在分享中提到,今年我们在新闻里听到了很多比较大的宕机事件,宕机的原因其实都很典型,删库跑路、被攻击、没有做好容量规划或者弹性能力不足、系统更改等。宕机后果还是比较严重,比如某SaaS服务商直接经济损失...
    文章 2020-11-12 7141浏览量
  • 读《SRE:Google运维解密》一点思考

    SRE在Google不负责某个服务的上线、部署,SRE主要是保障服务的可靠性和性能,同时负责数据中资源分配,为重要服务预留资源,SRE并不负责某个业务逻辑的具体编写,主要负责在服务出现宕机等紧急事故时,可以快速作出...
    文章 2019-12-16 2950浏览量
  • 饿了么交付中心语言栈转型总结

    上表格是业界服务高可用的几个级别的衡量标准,例如:服务可用性是3个9时,全年宕机时长约为8.76天的统计概率。另外,我们需要明确的是不同的系统,不同的场景以及不同的用户规模对系统可用性要求是不一样的。如:...
    文章 2019-11-08 2477浏览量
  • 《云安全原理与实践》——2.1 云计算面临的技术风险

    当然,为了做到这一点,攻击者必须获得受感染网络上另一台虚拟机的访问权。2.1.4 网络安全风险泛在接入作为云计算服务的五大特征之一,云环境下的网络安全问题也就自然而然地凸显出来。在网络风险方面,云计算主要...
    文章 2017-09-04 2797浏览量
  • 【转载】低成本和高性能的MySQL云数据库的实现淘宝 ...

    上述过程中,宕机的主库再次上线会使用户感受到短时间的不可写,进一步的,proxy服务器端可以通过捕捉错误,延迟重试的方法屏蔽掉这个问题。读写分离 我们还实现了对用户透明的读写分离。当功能的开关打开时,proxy...
    文章 2016-05-11 3649浏览量
  • 服务器建设选择阿里云

    还有,遇到宕机的时候,我们还需要为每个硬件准备冗余,部署与维护成本成本就上去了。同时,增减硬件也是挺麻烦的,带宽也是。有时候需要临时搞活动,硬件需要购置时间。带宽也不能提升,因为我这边的ISP服务商签约...
    文章 2020-07-03 340浏览量
  • 《Hadoop与大数据挖掘》——第2章 大数据存储与运算...

    第二名称节点的作用在于为HDFS中的名称节点提供一个Checkpoint,它只是名称节点的一个助手节点,这也是它在社区内被认为是Checkpoint Node的原因。如图2-3所示,只有在NameNode重启时,edits才会合并到fsimage文件中...
    文章 2017-07-03 2186浏览量
  • 云原生应用和容器设计模式的综述和展望

    如本系列文章前文所述,PetSet里的Pod有一个固定的编号和身份,对应固定的存储,一旦某个编号的Pod宕机,同样编号的Pod要被启动起来并挂在到同样的存储设备上,接替以前编号的Pod工作。以较真的角度说,“PetSet”这...
    文章 2016-12-13 2466浏览量
  • 血泪总结!创业公司CTO要避免哪些坑?

    先让我从印象最深的一次宕机讲起。有一天,有一台机器的容器挂了,我对技术人员说,你把机器重启一下吧!然后他就去了。结果没几秒钟,突然收到报警。我问那位同事,你做了什么?他反问,你不是让我重启服务器吗?...
    文章 2017-06-12 34226浏览量
  • 手动测试无法被取代的13个重要理由

    如果你想让触摸屏手机减少宕机的次数,进行手动测试是非常重要的。12.手动测试的通过率更高在测试中通过与否是需要考量的,我们要求自动测试软件一边模拟使用,一边呈现所有的测试结果。但对于大多数项目来说,可能...
    文章 2017-08-01 909浏览量
  • 手动测试无法被取代的13个重要理由

    如果你想让触摸屏手机减少宕机的次数,进行手动测试是非常重要的。12.手动测试的通过率更高在测试中通过与否是需要考量的,我们要求自动测试软件一边模拟使用,一边呈现所有的测试结果。但对于大多数项目来说,可能...
    文章 2017-10-03 780浏览量
  • 带你读《HBase原理与实践》之一:HBase概述

    因为稳定性的原因,并不建议在生产线上使用1.0.0~1.1.2中间的版本。目前,HBase社区推荐使用的稳定版本为1.4.10。2.x版本是接下来最受期待的一个版本(升级要慎重,请参考社区中的实践),因为最近一两年社区开发的...
    文章 2019-11-01 3526浏览量
1 2 3 4 5 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化