• 分布式系统数据层设计模式

    表示能容忍的从故障发生到系统恢复正常运转的时间,这个时间越短,容灾要求越高。RPO,Recovery Point Objective,数据恢复点目标。表示能容忍故障造成过去多长时间的数据丢失,RPO 为 0 表示不允许数据丢失。分布式...
    文章 2019-08-03 840浏览量
  • Linux的启动流程(CentOS 6)

    实际生产中,有些细节也很重要,包括整个启动过程中每一个环节如果出了故障应该如何修复,都是值得详细描述的知识点。以后有时间会回来重新更新补充,以图做到更好。个人博客地址:http://www.pojun.tech/ 欢迎访问...
    文章 2017-11-04 1094浏览量
  • 如何自底向上推导应用逻辑架构?...

    或者现在的架构上迭代需求故障和bug的情况是怎么样的,评估一下重构之后故障和bug率会降低到多少。只要现状和目标有一个没清晰,那我们就很难判断出问题的严重程度在哪里。FBI warning:如果你不能确定问题的严重...
    文章 2019-11-19 9931浏览量
  • 信息系统项目管理01——信息化和信息系统

    (2)MMTR——平均维护时间,可维护性用此度量,这是系统发生故障后维修和恢复正常花费的平均时间。1.4 软件工程 1 需求 1 好的需求应该具有无二义性、完整性、一致性、可测试性、确定性、可跟踪性、正确性、必要性...
    文章 2020-12-11 213浏览量
  • 如何做好一名稳定性SRE-业务团队系统稳定性的思与行

    自助是让你的客户自己动手,通过提供机器人,自动识别订单类型,自动排查订单状态和节点,自动告知服务规则特征,自动匹配问题类型给出排查结果或排查过程等。Google SRE设置了一个50%的上限值,要求SRE人员最多只在...
    文章 2020-10-26 7499浏览量
  • 《IT运维之道》一17.1 ITIL

    IT服务持续性管理关注的焦点是在发生服务故障后仍然能够提供预定级别的IT服务,从而支持组织的业务持续运作的能力。能力管理:能力管理是指在成本和业务需求的双重约束下,通过配置合理的服务能力使组织的IT资源发挥...
    文章 2017-05-02 2343浏览量
  • 《IT运维之道》——第17章 天外有天:IT服务的国际...

    IT服务持续性管理关注的焦点是在发生服务故障后仍然能够提供预定级别的IT服务,从而支持组织的业务持续运作的能力。能力管理:能力管理是指在成本和业务需求的双重约束下,通过配置合理的服务能力使组织的IT资源发挥...
    文章 2017-05-02 1483浏览量
  • 自动驾驶概述

    个人认为关键原因是激光雷达成本高落地难&xff0c;而视觉方案可以快速落地形成数据算法迭代优化的闭环。但激光雷达数据质量实在好&xff0c;对视觉方案有极大的补充价值&xff0c;甚至是主导价值&xff0c;而且成本已经大幅下降...
    文章 2021-11-30 249浏览量
  • 20 万网络节点背后的数据创新应用

    有部分同学个人的告警量达到1000条,一天有1440分钟,每一分钟都是在收告警,手机的耗电量和流量是很大的。这里涉及到无监督算法,我们的张戎博士会给大家分享下的。告警里面如果带上根源,此异常是根据某个数据服务...
    文章 2018-08-02 1209浏览量
  • 《研发企业管理——思想、方法、流程和工具》——1.9 ...

    1.9.2 企业的质量观念为了强调质量的重要性,但凡软件工程教科书总是要举一些历史上发生过的重大软件质量事故,如航天飞机爆炸、核电站失事、爱国者导弹发生故障等。学术界喜欢宣扬质量至上的理念,而忽视企业的利益...
    文章 2017-05-02 1612浏览量
  • 阿里集团搜索中台TisPlus

    其次很多时候运维管控操作是会出现反复,比如正在做全量任务流程中,出现需要更换机器怎么办,比如升级A版本过程中突然需要改回B版本了,又比如回滚B版本过程中又得升级到C版本怎么办?好吧遇到上述问题,过程式管控...
    文章 2018-01-26 7534浏览量
  • 承担集团数万应用、研发人员日常工作,阿里持续交付...

    beta 测试会产生资损故障怎么处理,真实流量进入后,如果有 bug,肯定会导致一些问题,虽然影响小,但是也会导致一些不可弥补的问题。测试数据难以维护,经常被污染怎么办,这是一个复杂而头疼的问题。为了解决以上...
    文章 2017-12-08 3179浏览量
  • 毕业10年才懂,会升层思考,工作有多轻松?

    2)解决架构上当前已经发生的问题:架构上的问题已经发生了,要对架构当前的问题进行识别,定义,以及解决(功能性&非功能性)。3)解决当前架构合理迭代的问题:我们在架构上进行大量迭代,迭代过程中往往容易...
    文章 2019-12-06 18241浏览量
  • 毕业10年才懂,会升层思考,工作有多轻松?

    2)解决架构上当前已经发生的问题:架构上的问题已经发生了,要对架构当前的问题进行识别,定义,以及解决(功能性&非功能性)。3)解决当前架构合理迭代的问题:我们在架构上进行大量迭代,迭代过程中往往容易...
    文章 2019-12-06 1388浏览量
  • 章文嵩(正明)博士和他背后的负载均衡(LOAD ...

    个人作为一个平凡的一线技术工程师,对章博士是很敬佩的(虽然他还不认识我),国内IT业界这么多年,在底层基石技术层面有所建树,打到Linux标准内核模块层面的应该就LVS了吧,而且就广泛影响力方面,LVS在Linux逐渐...
    文章 2016-05-26 16845浏览量
  • 章文嵩博士和他背后的负载均衡帝国

    个人作为一个平凡的一线技术工程师,对章博士是很敬佩的(虽然他还不认识我),国内IT业界这么多年,在底层基石技术层面有所建树,打到Linux标准内核模块层面的应该就LVS了吧,而且就广泛影响力方面,LVS在Linux逐渐...
    文章 2016-05-30 9787浏览量
  • Java微服务开发指南-Java环境下的微服务

    但是问题总会出现,所以我们需要让应用能够优雅的处理失败而不是防止它发生,我们应该能够优雅的处理失败,而不是看着它不断向上抛出,最终导致整个系统崩溃。构建一个分布式系统远比构建一个共享内存、单进程的单体...
    文章 2017-10-17 8171浏览量
  • 带你读《基于CUDA的GPU并行程序开发指南》之一:CPU...

    现在,让我们看看如果Fred的拖拉机发生故障后会发生什么。过去他们每分钟都能收获两颗椰子,但现在他们只有一台拖拉机和一把椰子锤。他们把拖拉机开到椰子树附近,并停在那儿。他们必须依次地执行线程1(Th1)和线程...
    文章 2019-11-16 2686浏览量
  • [重磅]永生or灭绝?人工智能给出答案(下)

    指数级增长虽然能很快的制造数万亿的纳米机器人,但这也是它可怕的地方——如果系统出故障了,指数级增长没有停下来,那怎么办?纳米机器人将会吞噬所有碳基材料来支持自我复制,而不巧的是,地球生命就是碳基的。...
    文章 2017-05-02 1841浏览量
  • MySQL 入门(1):查询和更新的内部实现

    对于一个 SQL 语句,分析器首先进行词法分析,对sql语句进行拆分,识别出各个字符串代表的含义。然后就是语法分析,分析器根据定义的语法规则判断sql语句是否满足 MySQL 语法。所以,如果我们看到You have an error ...
    文章 2020-04-30 343浏览量
  • 关于程序员的职业操守,从《匠艺整洁之道》谈起

    而随着个人计算机的出现&xff0c;《黑客帝国》、《战争游戏》等电影逐渐以程序员作为救世主&xff0c;程序员正脱去神秘的面纱&xff0c;被社会所了解和接纳。▐ 影响面扩大&xfeff;作为程序员&xff0c;我们虽然不是各种规则的...
    文章 2022-07-08 161浏览量
  • 高并发,我把握不住啊!

    个人网站初代淘宝的团队人员只有十来个&xff0c;而且面临千载难逢的商业机会&xff0c;所以要求上线的时间越快越好&xff08;实际用了不到一个月&xff09;xff0c;那么淘宝的这些牛人是怎么做到的呢&xff1f;——买一个。初代淘宝...
    文章 2021-12-23 93浏览量
  • 分布式一致性算法Raft简介(上)

    Consensus Module(一致性模块,图中有标注,是machine里的一个协调控制模块)的工作职责是管理这些logs,确保被合理地复制,并决定什么时候将这些logs中的command提交给state machine执行(其实consensus module...
    文章 2017-03-27 1209浏览量
  • Redis学习总结-《我的Java打怪日记》

    每次来任务之后对任务进行识别和分发&xff0c;每种处理函数只处理一种业务&xff0c;这种模型更加符合OO的设计理念&xff0c;这也是Reactor反应堆模式的设计思路。反应堆模式是一种对象行为的设计模式&xff0c;主要同于同步IO&...
    文章 2021-07-17 11357浏览量
  • 秋招结束面试和面经的总结(个人向)

    自我介绍:文案:​参考:面经总结:项目中可以装逼的:1.弹幕娱乐:直播是眼下最为火爆的行业,而弹幕无疑是直播平台中最流行、最重要的功能之一。本文将讲述如何实现兼容 PC 浏览器和移动浏览器的弹幕。...
    文章 2021-10-10 197浏览量
  • Java面试题总结(一)

    弱引用也是用来描述非必需对象的,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。在JDK 1.2...
    文章 2022-05-27 63浏览量
  • Cookie、Session、Token与JWT解析

    Nginx 的 sticky 模块可以支持这种方式&xff0c;支持按 ip 或 cookie 粘连等等&xff0c;如按 ip 粘连方式如下这样的话每个 client 请求到达 Nginx 后&xff0c;只要它的 ip 不变&xff0c;根据 ip hash 算出来的值会打到固定的...
    文章 2022-05-20 188浏览量
  • 秒杀架构分析与实践

    且调度器自动屏蔽掉服务器的故障&xff0c;从而将一组服务器构成一个高性能的、高可用的虚拟服务器。3、Nginx想必大家都很熟悉了&xff0c;是一款非常高性能的 HTTP 代理/反向代理服务器&xff0c;服务开发中也经常使用它来做...
    文章 2022-08-12 227浏览量
  • 带你读《物联网之魂:物联网协议与物联网操作系统》之...

    孙昊 王洋 赵帅 杜秀芳 曾凡太 编著第1章 网络通信技术 1.1 数字通信概述 数字通信是指用数字信号作为载体来传输信息,或者用数字信号对载波进行数字调制后再传输的通信方式。它的主要技术设备包括发射器、接收器及...
    文章 2019-11-12 1439浏览量
  • 1269道Java技术答疑,阿里技术专家帮你Java技术进阶

    我的问题是:SpringBoot2.0 版本迭代以来,我们最关心的其实还是SpringCloud这个SOA框架发生的一些变化。比如说相对于SpringBoot 1.x 版本,2.0 关闭一些框架内提供的接口数据的访问,比如说 健康检测 心跳之类的 ...
    文章 2018-11-22 5540浏览量
1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化