• Windows Azure HandBook(1)IaaS相关技术

    Fabric Controller也处理虚拟机的健康管理工作(Health Management)工作,当Microsoft Azure Guest OS发生死机时,会由Fabric Controller自动选择不同的实体机器重新部署启动。在单台Guest OS的情况下,当Guest OS...
    文章 2017-10-04 915浏览量
  • [New Portal]Windows Azure Virtual Machine(1)概念

    Fabric Controller也处理虚拟机的健康管理工作(Health Management)工作,当Microsoft Azure Guest OS发生死机时,会由Fabric Controller自动选择不同的实体机器重新部署启动。在单台Guest OS的情况下,当Guest OS...
    文章 2017-04-30 1156浏览量
  • 玩转ECS第3讲|ECS自助服务之智能诊断和自动化修复

    自助修复工具背后,需要厂商有准确的健康诊断能力,发现故障的存在产生的原因。ECS最常见的问题可以分为四类:实例无法远程访问、实例无法启动和停止、实例性能异常、磁盘扩容未生效等。实例无法远程访问,包含SSH...
    文章 2020-10-28 5151浏览量
  • Flink on K8s 在京东的持续优化实践

    进程不健康、进程异常退出、docker 异常重启等也都会导致 pod 重启。此时,会导致任务重启恢复,对业务造成影响。那么如何才能减少对业务的影响?一个方面是针对容器环境,加快 pod 异常(被驱逐或重启)的感知速度,...
    文章 2022-04-01 745浏览量
  • Flink 引擎在快手的深度优化生产实践

    Flink 为了做到 exactly-once,任何节点出现故障都需要重启整个作业,全局重启会带来长时间的停顿,最高可达十几分钟。有些场景不追求 exactly-once,比如推荐等实时场景,但它们对服务可用性的要求很高,无法容忍...
    文章 2022-07-08 621浏览量
  • 独家揭秘:微博深度学习平台如何支撑4亿用户愉快吃瓜...

    图 7 客户端负载均衡另外,基于 K8s 的探针模式实现了服务的健康检查,服务上线之后,通过执行业务自定义的健康检查命令进行检查 Pod,如果这个 Pod 失效,我们会将这种无状态的服务进行重启。业务方上线的这些服务...
    文章 2020-12-31 1805浏览量
  • 【K8S专栏】什么是Kubernetes

    通过声明式语法提供了强大的自修复能力使用 Kubernetes,您可以快速高效地响应客户需求:快速、可预测地部署您的应用程序拥有即时扩展应用程序的能力不影响现有业务的情况下&xff0c;无缝地发布新功能优化硬件资源&xff0c...
    文章 2022-08-06 43浏览量
  • 剑指offer之java缓存总结,从单机缓存到分布式缓存...

    1、提高读取吞吐量2、提升应用程序性能3、降低数据库成本4、减少后端负载5、消除数据库热点6、可预测的性能3、缓存分类3.1、单机缓存&xff08;localCache&xff09;实现方案1、基于JSR107规范自研&xff08;了解即可&xff09;...
    文章 2022-05-04 36浏览量
  • RPC架构设计方法论(完结)

    利用 ZooKeeper 的 Watcher 机制完成服务订阅服务下发功能服务端管理平台先在 ZooKeeper 中创建一个服务根路径&xff0c;可以根据接口名命名&xff08;例如&xff1a;service/com.demo.xxService)xff0c;在这个路径下...
    文章 2022-04-22 106浏览量
  • 阿里测试环境运维及研发效率提升之道

    对于测试环境来说,我们在中间插了一层,就是资源池的动态分配,这个系统有五个模块,分别是宿主机评分,应用环境分级,资源池管理(就是对资源池怎么进行合理的调度和分配),容量预测,最后一个是分配器。...
    文章 2018-01-11 7127浏览量
  • 阿里万亿交易量级下的秒级监控

    只有核心的设计,代码体量小维护也简单,其实我们计算框架做出来以后,几乎没有产生过什么 BUG,因外它只做了消息分发线程池管理故障守护这几件事情。在数据库选择上,当前我们是直接写 Hbase,正在和 HiTSDB 团队...
    文章 2017-12-07 6157浏览量
  • Uber首席系统架构师Matt Ranney:可伸缩的软件系统...

    SWIM结合了健康检查成员变更作为同一协议的一部分 在ringpop系统中,存在包含ringpop模块的所有Node进程。他们闲置在当前的成员周围。从外部看,如果DISCO要消耗地理空间,每个Node是等价的。一个健康节点是随机...
    文章 2017-11-20 1835浏览量
  • Uber首席系统架构师Matt Ranney:可伸缩的软件系统...

    SWIM结合了健康检查成员变更作为同一协议的一部分 在ringpop系统中,存在包含ringpop模块的所有Node进程。他们闲置在当前的成员周围。从外部看,如果DISCO要消耗地理空间,每个Node是等价的。一个健康节点是随机...
    文章 2016-03-17 3608浏览量
  • 年终盘点丨细数2017云栖社区20大热点话题(附100+话题...

    从老美“春晚”直播故障频出,聊聊千万级在线直播技术的难点解法 一年一度的“超级碗”是全美瞩目的时段,美国的几家直播网站却不敢恭维,频频出现断网事故,令观众无比尴尬。比如服务商Comcast的宽带却因故中止了...
    文章 2018-01-09 11023浏览量
  • 应用运维智能化的关键技术——《应用智能运维实践...

    以及应用运行期负载趋势预测与容量规划等。围绕这些场景&xff0c;我们需要从当前可用的统计、机器学习、人工智能和自治控制技术堆栈中匹配相关的算法。总的来说&xff0c;当前能够匹配企业应用运维场景、可以用来解决实际...
    文章 2021-07-06 597浏览量
  • REST 十诫

    这使得阅读、写入、测试和管理都变得更加简单。记住,在不确定的情况下,请使用 JSON。我们所有开发人员在此都会向你表示衷心的感谢。2.有条理你一定不会相信,我已经见过很多次 API 只使用 GET 方法来做从数据存储...
    文章 2022-05-11 33浏览量
  • 云原生体系下的技海浮沉理论探索

    结合可靠的自动化手段,云原生技术使工程师能够轻松地对系统作出频繁和可预测的重大变更。云原生计算基金会(CNCF)致力于培育和维护一个厂商中立的开源生态系统,来推广云原生技术。通过将最前沿的模式民主化,让...
    文章 2020-12-14 1259浏览量
  • 云原生体系下的技海浮沉理论探索

    结合可靠的自动化手段,云原生技术使工程师能够轻松地对系统作出频繁和可预测的重大变更。云原生计算基金会(CNCF)致力于培育和维护一个厂商中立的开源生态系统,来推广云原生技术。通过将最前沿的模式民主化,让...
    文章 2020-12-01 7077浏览量
  • 带你走进微服务Microservice

    2.微服务由来 微服务最早由Martin FowlerJames Lewis于2014年共同提出&xff0c;微服务架构风格是一种使用一套小服务来开发单个应用的方式途径&xff0c;每个服务运行在自己的进程中&xff0c;并使用轻量级机制通信&xff0c;...
    文章 2022-05-23 72浏览量
  • 自动化运维Kubernetes

    Kubernetes scheduler将始终确保每个应用程序组件都是经过健康检查的,提供高可用的服务,当副本数量设置为多个时,每个实例在多个主机上进行调度,并且如果其中一个主机变为不可用时,所有在该台主机上运行的容器...
    文章 2018-12-18 4252浏览量

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化