核心态常见故障

  • 如何有效可靠地管理大规模 Kubernetes 集群?

    前言 Kubernetes 以其超前的设计理念和优秀的技术架构,在容器编排领域拔得头筹。越来越多的公司开始在生产环境部署实践 Kubernetes,在阿里巴巴和蚂蚁金服 Kubernetes 已被大规模用于生产环境。 Kubernetes 的出现使得广大开发同学也能运维复杂的分布式系统,它大幅降低...

    文章 缪克卢汉 2019-08-15 799浏览量

  • 万级规模 K8s 如何管理?蚂蚁双11核心技术公开

    阿里妹导读:Kubernetes 大幅降低了容器化应用部署的门槛,并以其超前的设计理念和优秀的技术架构,在容器编排领域拔得头筹。越来越多的公司开始在生产环境部署实践。本文将分享蚂蚁金服是如何有效可靠地管理大规模 Kubernetes 集群的,并会详细介绍集群管理系统核心组件的设计。 系统概览 K...

    文章 技术小能手 2019-11-13 5861浏览量

  • 备战双 11!蚂蚁金服万级规模 K8s 集群管理系统如何设计?

    作者 | 蚂蚁金服技术专家 沧漠 关注『阿里巴巴云原生』公众号,回复关键词“1024”,可获取本文 PPT。 前言 Kubernetes 以其超前的设计理念和优秀的技术架构,在容器编排领域拔得头筹。越来越多的公司开始在生产环境部署实践 Kubernetes,在阿里巴巴和蚂蚁金服 Kubernete...

    文章 阿里巴巴云原生小助手 2019-10-28 5061浏览量

  • 超全总结 | 阿里如何应对电商故障?神秘演练细节曝光

    近日,在 QCon北京2017大会上,来自阿里巴巴中间件团队的技术专家周洋(花名中亭)发表了题为《阿里电商故障治理和故障演练实践》专题演讲。在会后官方组织的评选中,本次演讲的内容得到了一致好评,中亭获选为本次大会的明星讲师。此次演讲整体上分享了从 2011 年至今,阿里巴巴电商平台遇到的诸多有代表...

    文章 技术小能手 2017-06-19 3230浏览量

  • 鲜为人知的混沌工程,到底哪里好?

    阿里妹导读:混沌工程属于一门新兴的技术学科,行业认知和实践积累比较少,大多数IT团队对它的理解还没有上升到一个领域概念。阿里电商域在2010年左右开始尝试故障注入测试的工作,希望解决微服务架构带来的强弱依赖问题。通过本文,你将了解到:为什么需要混沌工程,阿里巴巴在该领域的实践和思考、未来的计划。 ...

    文章 技术小能手 2019-01-29 2859浏览量

  • 系统稳定性——So Hot? 快给 CPU 降降温!

    作者:夏明(涯海) 创作日期:2019-08-14 专栏地址:【稳定大于一切】 CPU(Central Processing Unit)是计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元,相当于系统的“大脑”。当 CPU 过于繁忙,就像“人脑”并发处理过多的事情,会降低做事的效率...

    文章 激情的涯海 2019-08-26 852浏览量

  • 走近华佗,解析自动化故障处理系统背后的秘密

    集群医生华佗是集群自动化故障监测和处理系统,是平台和运维对接的关键系统。一方面完成飞天其他组件不擅长的OS和硬件的故障自动监测和处理,另一方面推动飞天去及时规避硬件和OS引起的故障,使得故障能够闭环运转,大幅度减少故障处理成本和造成的影响。飞天5K项目期间的规模效应凸显出自动化处理故障的必要性,大...

    文章 yq传送门 2016-12-18 4331浏览量

  • 双11 背后的全链路可观测性:阿里巴巴鹰眼在“云原生时代”的全面升级

    本文节选自《不一样的 双11 技术:阿里巴巴经济体云原生实践》一书 作者:周小帆(承嗣)  阿里云中间件技术部高级技术专家王华锋(水彧)  阿里云中间件技术部技术专家徐彤(绍宽)  阿里云中间件技术部技术专家夏明(涯海)  阿里云中间件技术部技术专家 导读:作为一支深耕多年链路追踪技术 (Trac...

    文章 阿里巴巴云原生小助手 2019-12-20 355浏览量

  • 五分钟了解一致性的分类及其理论

    1、强一致性 这种一致性级别是最符合用户直觉的,它要求系统写入什么,读出来的也会是什么,用户体验好,但实现起来往往对系统的性能影响大。 2、弱一致性 这种一致性级别约束了系统在写入成功后,不承诺立即可以读到写入的值,也不久承诺多久之后数据能够达到一致,但会尽可能地保证到某个时间级别(比如秒级别)后...

    文章 colincheng 2017-03-27 707浏览量

  • 130 秒揭秘 EDAS 3.0 如何平滑应对突发流量高峰,为您的业务保驾护航

    "在 PaaS 层面,我们始终拥抱开源技术,并保持和社区版本兼容的时效性;在企业特性上,例如服务治理、应用监控等方面,我们提供一个稳定成熟的产品,来降低企业构建互联网化应用的门槛,例如企业级应用服务 EDAS3.0 就是这样一个典型的产品"——阿里巴巴合伙人、阿里云智能基础产品事业部 高级研究员蒋...

    文章 中间件小哥 2020-10-12 1993浏览量

  • 带你读《ONAP技术详解与应用实践》之三:ONAP架构设计

    点击查看第一章点击查看第二章 第3章 ONAP架构设计本章首先介绍ONAP架构在设计之初的目标与理念,包括要解决什么问题、需要具备哪些核心能力、相应的架构设计理念和设计原则是什么等。对于模型驱动等重要设计原则,还辅以具体示例,包括ONAP的实现流程与模型定义示例。理解这些设计理念与原则后,再一步步...

    文章 温柔的养猫人 2019-11-07 746浏览量

  • 分享实录 | 阿里巴巴DevOps文化浅谈

    【以下内容为分享实录,有删节】 DevOps发展的三个阶段 首先我们简单看一下什么是DevOps,这个词从何而来。我在这里把DevOps发展历史分为三个阶段:诞生期、定义期和落地期。 DevOps的“祖师爷”是比利时一名独立IT咨询师Patrick Debois。2007年,他负责一个大型项目的...

    文章 混合云君 2020-03-30 1494浏览量

  • DevOps:软件架构师行动指南2.2 云的特性

    2.2 云的特性 云最根本的推动者是构筑在成千上万通过因特网访问的主机之上的虚拟化技术。我们首先探讨以IaaS为中心的特性,即虚拟化和IP管理,接着是PaaS提供的一些特性。然后,我们探讨一些普遍的问题,例如数以万计的主机所带来的后果,以及云是如何支持弹性的。 2.2.1 虚拟化 在云计算中,虚...

    文章 华章计算机 2017-05-02 1646浏览量

  • 带你读《ONAP技术详解与应用实践》之一:网络自动化挑战及ONAP介绍

    点击查看第二章点击查看第三章ONAP技术详解与应用实践 任旭东 著 第1章 网络自动化挑战及ONAP介绍什么是ONAP?运营商在网络转型中遇到的挑战是什么?云服务厂商和OTT服务商在其网络自动化实践中有何经验可以借鉴?为什么ONAP是电信产业网络自动化领域最有前景的开源实现方式?本章试图从以上几...

    文章 温柔的养猫人 2019-11-07 1472浏览量

  • 初创公司5大Java服务困局,阿里工程师如何打破?

    阿里妹导读:初创公司遇到的每一个问题都可能攸关生死。创业之初更应该总结行业的常见问题,对比方案寻找最优解。阿里巴巴地图技术专家常意在技术圈摸爬滚打数年,接触了各式各样的Java服务端架构。服务端问题见得多了,也就更能分辨出各种方案的优劣。今天,常意总结了5大初创公司存在的Java服务端难题,并尝试...

    文章 技术小能手 2019-11-06 11313浏览量

  • 带你读《Prometheus监控实战》之一:监控简介

    云计算与虚拟化技术丛书点击查看第二章点击查看第三章Prometheus监控实战Monitoring with Prometheus[澳] 詹姆斯·特恩布尔(James Turnbull) 著史天 张媛 肖力 译第1章 监 控 简 介 本书的核心是Prometheus,一个开源的监控系统,它从应用程...

    文章 被纵养的懒猫 2019-11-11 2735浏览量

  • Linux信号专题FAQ

    信号: 基本概念 可重入、线程安全以及异步信号安全的区别? ​   参考可重入、线程安全和异步信号安全,需要强调的是异步信号安全,这个概念知道的人不多,平常大家在编写代码的时候也很少考虑这个因素,也不清楚哪些函数是异步信号安全的,哪些不是,典型的像printf就不是异步信号安全的,内部会加锁,但是...

    文章 jeff216 2018-04-11 1086浏览量

  • 4G LTE同构宏蜂窝和异构微蜂窝概述 | 带你读《5G UDN(超密集网络)技术详解》之三

    第一章 5G 前蜂窝移动历史 1.1 5G前蜂窝移动系统和业务概述 |1.2 4G LTE同构宏蜂窝和异构微蜂窝概述 | 4G 时代最有代表性的蜂窝移动系统就是 LTE,对应的无线接入技术就是 E-UTRA,它由 3GPP 项目组织领导进行了多版本的标准化。从 2008 年的 Rel-8 初始版...

    文章 被纵养的懒猫 2019-12-24 337浏览量

  • 那些年,我们见过的 Java 服务端“问题”

    导读 明代著名的心学集大成者王阳明先生在《传习录》中有云: 道无精粗,人之所见有精粗。如这一间房,人初进来,只见一个大规模如此。处久,便柱壁之类,一一看得明白。再久,如柱上有些文藻,细细都看出来。然只是一间房。 是的,知识理论哪有什么精粗之分,只是人的认识程度不同而已。笔者在初创公司摸爬滚打数年,...

    文章 中间件小哥 2019-10-08 7482浏览量

  • 【盘点篇】从安全、稳定、高可用、高性能、智能等维度看阿里云存储 2018

    2008年,为了探索阿里巴巴集团大规模存储解决之道,阿里云存储自研飞天大规模的分布式存储引擎(盘古 1.0 ),从写下第一行代码开始,阿里云存储的进化之路正式开启。 作为阿里云飞天系统里极其重要的一环,阿里云存储的使命不仅解决了双 11、双 12、蚂蚁金服等集团大规模业务对存储系统的超高要求和挑战...

    文章 株莉 2019-02-26 7712浏览量

  • 一个秒杀系统的设计思考

    秒杀大家都不陌生。自2011年首次出现以来,无论是双十一购物还是 12306 抢票,秒杀场景已随处可见。简单来说,秒杀就是在同一时刻大量请求争抢购买同一商品并完成交易的过程。从架构视角来看,秒杀系统本质是一个高性能、高一致、高可用的三高系统。而打造并维护一个超大流量的秒杀系统需要进行哪些关注,就是...

    文章 云管家chinaygj 2020-06-23 1188浏览量

  • 浅谈:前端如何赋能业务?

    你是否头疼于,每天做不完的需求和改不完的bug? 你是否发愁,每天撸业务代码,是否能获得技术成长? 而追求成就感的你是否想过,你所编写的一行行代码,是在反复的变化中迅速成为遗留代码,还是助公司插上腾飞的翅膀,在你死我活的战场上脱颖而出? 因此本文会将业务和前端关联起来讨论,探讨业务发展的不同时期,...

    文章 岳渊 2019-04-17 1413浏览量

  • 面向失败的设计-概述

    一、引言 一个优秀的架构师通常都是一个悲观主义者,除了设计好能够支撑业务持续发展的优雅架构,另一个容易被忽略的重要能力在于充分考虑失败场景。如果对失败场景考虑不够充分,轻则出现业务不可用,影响用户体验和企业声誉;重则导致数据永久丢失、业务再无恢复可能。2001 年 9 月 11 日,美国世贸中心双...

    文章 KB小秘书 2019-11-08 742浏览量

  • 云原生存储系列文章(一):云原生应用的基石

    导读:存储服务支撑了应用的状态、数据的持久化,是计算机系统中的重要组成部分,也是所有应用得以运行的基础,其重要性不言而喻。在存储服务演进过程中,每一种业务类型、新技术方向都会对存储的架构、性能、可用性、稳定性等提出新的要求,而在当今技术浪潮走到云原生技术普及的时代,存储服务需要哪些特性来支持应用呢...

    文章 创业头条-吴松 2020-07-24 192浏览量

  • 带你读《KVM实战:原理、进阶与性能调优》之二:KVM原理简介

    点击查看第一章点击查看第三章 第2章 KVM原理简介 2.1 硬件虚拟化技术 通过第1章的介绍,大家已经知道KVM虚拟化必须依赖于硬件辅助的虚拟化技术,本节就来介绍一下硬件虚拟化技术。最早的硬件虚拟化技术出现在1972年的大型机IBM System/370 系统上,而真正让硬件虚拟化技术“走入寻常...

    文章 温柔的养猫人 2019-10-31 1590浏览量

  • 云原生存储系列文章(一):云原生应用的基石

    作者| 郡宝 阿里云技术专家 参与文末留言互动,即有机会获得赠书福利! 导读:存储服务支撑了应用的状态、数据的持久化,是计算机系统中的重要组成部分,也是所有应用得以运行的基础,其重要性不言而喻。在存储服务演进过程中,每一种业务类型、新技术方向都会对存储的架构、性能、可用性、稳定性等提出新的要求,而...

    文章 阿里巴巴云原生小助手 2020-06-12 419浏览量

  • 为什么说优秀架构师往往是一个悲观主义者?

    阿里妹导读:18年前,200家企业由于在事故中信息系统遭到严重破坏而永远地关闭了。这样的事故引发了后人深思,对于工程师而言,不仅要求设计的系统足够强壮,还需要具备考虑失败的能力,当失败场景悉数被考虑周全、并且结合充分的演练,一切会不会不一样?我们熟知面向对象设计和面向程序设计,阿里巴巴资深技术专家...

    文章 技术小能手 2019-06-18 24211浏览量

  • 阿里云智能--基础产品技术月刊2019年7月

    一、 商用产品技术TOP1 面向 I/O 密集型关键业务场景,全球首款百万级 IOPS 的企业级云盘(ESSD云盘)正式商业化为满足企业级客户全站上云场景下对存储性能需求,阿里云于2018年正式推出了全球首款百万级IOPS的企业级ESSD云盘,搭配ECS企业级云服务器使用。ESSD可提供单盘...

    文章 宝惜 2019-08-09 2687浏览量

  • 每秒7亿次请求,阿里新一代数据库如何支撑?

    作者 | 正研 2019年以来,Lindorm已经服务了包括淘宝、天猫、蚂蚁、菜鸟、妈妈、优酷、高德、大文娱等数十个BU,在今年的双十一中,Lindorm峰值请求达到了7.5亿次每秒,天吞吐22.9万亿次,平均响应时间低于3ms,整体存储的数据量达到了数百PB。 这些数字的背后,凝聚了HBase&...

    文章 檸,铮 2019-12-11 696浏览量

  • 万字干货 | 每秒7亿次请求,阿里新一代数据库如何支撑?

    作者:正研,阿里云数据库技术专家 导读 Lindorm,就是云操作系统飞天中面向大数据存储处理的重要组成部分。Lindorm是基于HBase研发的、面向大数据领域的分布式NoSQL数据库,集大规模、高吞吐、快速灵活、实时混合能力于一身,面向海量数据场景提供世界领先的高性能、可跨域、多一致、多模型的...

    文章 Roin123 2019-12-11 326浏览量

1 2 3 >

云产品推荐

阿里云大学 云服务器ECS com域名 网站域名whois查询 开发者平台 小程序定制 小程序开发 国内短信套餐包 开发者技术与产品 云数据库 图像识别 开发者问答 阿里云建站 阿里云备案 云市场 万网 阿里云帮助文档 免费套餐 开发者工具 企业信息查询 小程序开发制作 视频内容分析 企业网站制作 视频集锦 代理记账服务 企业建站模板