过载点一般会出现什么故障

  • 服务器故障排查的前五分钟[转]

    我们团队为上一家公司承担运维、优化和扩展工作的时候,我们碰到了各种不同规模的性能很差的系统和基础设备(大型系统居多,比如CNN或者世界银行的系统)。要是再赶上修复时间紧、奇葩的技术平台、缺少信息和文档,基本上这过程都会惨痛到让我们留下深刻的记忆。 遇到服务器故障,问题出现的原因很少可以一下就想到。...

    文章 cnhejia 2016-04-07 1924浏览量

  • 首次揭秘!​春晚活动下快手实时链路保障实践

    摘要:本文由快手开发工程师刘建刚分享,主要介绍春晚活动下快手实时链路保障实践。内容主要包含以下四部分: 快手 Flink 简介 春晚实时保障方案 春晚实时大屏 未来规划 Tips:点击「阅读原文」链接可查看作者原版 PPT 及分享视频~ 一、快手 Flink 简介 我们首先来看一下快手的实时...

    文章 阿里云实时计算Flink 2020-06-29 219浏览量

  • Linux 服务器故障排除的前五分钟 (First 5 Minutes Troubleshooting A Linux Server)

    一、前言 二、简介 三、具体过程 尽可能搞清楚问题的前因后果 有谁在? 之前发生了什么? 现在在运行的进程是啥? 监听的网络服务 CPU和内存使用情况 查看硬件 I/O 性能 挂载点和文件系统 内核、中断和网络 系统日志和内核消息 任务计划 查看...

    文章 技术小美 2017-11-07 1002浏览量

  • 云原生下,如何保障业务系统的高可用性?

    讲师:牛兔(张春梅) 本次分享将按照以下四个方面展开: 高可用体系 云上PTS服务 AHAS流量防护 一.高可用体系 1.高可用体系概念:除了像日常代码功能测试之外,其他与业务稳定性或者可用性相关的都可成为高可用体系,所谓高可用即就是让业务和服务高可用。2.高可用体系按照功能或者业务实现可以分为:...

    文章 琛琛轴子 2020-06-19 196浏览量

  • 从Netflix的Hystrix框架理解服务熔断和服务降级

    本文讲的是从Netflix的Hystrix框架理解服务熔断和服务降级,伴随着微服务架构被宣传得如火如荼,一些概念也被推到了我们面前,其实大多数概念以前就有,但很少被提的这么频繁。想起有人总结的一句话,微服务架构的特点就是:“一解释就懂,一问就不知,一讨论就吵架”。 其实对老外的总结能力一直特别崇拜...

    文章 晚来风急 2017-09-04 3269浏览量

  • 微博热点事件背后数据库运维的“功守道”

    作者:张冬洪 背景&挑战 背景 正是图1这条微博动态,让一个平常的国庆假期变得不同寻常,微博刚一发出就引爆网络,它将明星CP动态推向了舆论的高潮,并霸占微博热搜榜好几天,也正是因为这个突发的流量,致使流量过大一度引发微博服务器瘫痪,而成为吃瓜群众热议的话题。微博拥有超过3.76亿月活用...

    文章 zhangdh1113 2018-09-27 1161浏览量

  • 疫情期,APP 崩了怎么办?阿里工程师公开高可用架构笔记

    阿里巴巴在多年 双11 高并发,高可用和高客户体验要求背景下积累了相应的技术体系,并赋能罗辑思维等客户,帮助他们落地全链路压测。本文整理自高用户、突发高流量场景下的真实案例,公布阿里在高可用架构建设过程中的实践笔记,期待帮助更多企业从容应对接下来的高流量场景。 你的应用为什么崩了? 非常复杂的服务...

    文章 檸,铮 2020-02-18 4514浏览量

  • DevOps老司机如何兼顾运维与开发?(附脑图)

    运维开发这个岗位与普通的业务开发不同,与日常的运维工作也不同。要求兼顾开发与运维两种能力。既要掌握不弱于业务开发的开发技术;又要负责SRE同学日常的运维能力;上线之前,还要像QA同学一样,对自己的服务进行测试和分级变更。 多种能力的交叉,造就不一样的视角:这群人给自己起了一个很简约的名字:DevO...

    文章 技术小能手 2018-05-08 7624浏览量

  • 年轻人不讲武德,偷袭阿里的机房

    作者:半佛仙人 1 从商业的角度来看,无论是技术还是产品,过于极致的稳定都是一种累赘。有人讲过一个故事,有一个公司生产出了绝对不会故障和损坏,可以永久使用的产品。 顺理成章的,这个公司的产品迅速占领了市场,把竞争对手打得落花流水。 接下来会怎样?它会更加迅速地倒闭。 这同样很合理:他们既不能向客...

    文章 开发者小助手 2020-11-18 973浏览量

  • 阿里HBase高可用8年“抗战”回忆录

    2017年开始阿里HBase走向公有云,我们有计划的在逐步将阿里内部的高可用技术提供给外部客户,目前已经上线了同城主备,将作为我们后续高可用能力发展的一个基础平台。本文分四个部分回顾阿里HBase在高可用方面的发展:大集群、MTTF&MTTR、容灾、极致体验,希望能给大家带来一些共鸣和思考...

    文章 Roin123 2019-11-04 3378浏览量

  • 2020年SpringCloud 必知的18道面试题

    今天跟大家分享下SpringCloud常见面试题的知识。 1、什么是Spring Cloud? Spring cloud流应用程序启动器是基于Spring Boot的Spring集成应用程序,提供与外部系统的集成。Spring cloud Task,一个生命周期短暂的微服务框架,用于快速构建执行有...

    文章 程序员白楠楠 2020-11-12 353浏览量

  • 阿里HBase高可用8年“抗战”回忆录

    HBase用户福利 新用户9.9元即可使用6个月云数据库HBase,更有低至1元包年的入门规格供广大HBase爱好者学习研究,更多内容请参考链接 前言 2011年毕玄和竹庄两位大神将HBase引入阿里技术体系,2014年接力棒转到东8区第一位HBase commiter天梧手中,多年来与淘宝、旺旺...

    文章 daniel.meng 2019-10-17 1427浏览量

  • Service Mesh 高可用在企业级生产中的实践

    Service Mesh Virtual Meetup 是 ServiceMesher 社区和 CNCF 联合主办的线上系列直播。本期为 Service Mesh Virtual Meetup#1 ,邀请了四位来自不同公司的嘉宾,从不同角度展开了 Service Mesh 的应用实践分享,分享涵盖...

    文章 花肉酱 2020-06-03 127浏览量

  • 谈谈互联网后端基础设施

    纵观整个互联网技术体系再结合公司的目前状况,个人认为必不可少或者非常关键的后端基础技术/设施如下图所示: Api网关 业务应用和后端基础框架 缓存、数据库、搜索引擎、消息队列 文件存储 统一认证中心 单点登录系统 统一配置中心 服务治理框架 统一日志服务 数据基础设施 故障监控 这里的...

    文章 jurassic_1 2016-12-09 4897浏览量

  • 数据中心双电源自动切换开关详解

    双电源自动切换开关指的是一种由微处理器控制,用于电网系统中网电与网电或网电与发电机电源启动切换的装置,可使电源连续源供电。当常用电突然故障或停电时,通过双电源切换开关,自动投入到备用电源上(小负荷下备用电源也可由发电机供电),使设备仍能正常运行。最常见的是电梯、消防、监控上、照明等。 双电源自动切...

    文章 行者武松 2017-09-11 3572浏览量

  • 三篇文章了解 TiDB 技术内幕 —— 谈调度

    任何一个复杂的系统,用户感知到的都只是冰山一角,数据库也不例外。 前两篇文章介绍了 TiKV、TiDB 的基本概念以及一些核心功能的实现原理,这两个组件一个负责 KV 存储,一个负责 SQL 引擎,都是大家看得见的东西。在这两个组件的后面,还有一个叫做 PD(Placement Driver)的组...

    文章 boxti 2017-06-02 1418浏览量

  • Redis经典面试题总结

    概述 什么是Redis? Redis 是一个使用 C 语言写成的,开源的高性能key-value非关系缓存数据库。它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash(哈希类型)。Redis的数据...

    文章 clover2837 2020-09-26 1111浏览量

  • 是时候聊一下程序员争相追逐的“香馍馍” Istio了

    2017 年年初,我所在的公司开始对整个业务系统进行重构和微服务化,替换掉因业务发展而不堪重负的、运行了 10 年的庞大的单体应用。我有幸作为小组技术负责人,负责部分业务的微服务架构的设计和开发工作。  随着微服务迁移工作的深入,服务化过程中遇到的问题越来越多,痛点也越加明显。当我们的业务被拆分成...

    文章 异步社区 2019-08-30 1635浏览量

  • 谈谈互联网后端基础设施

    本文更新于2016.12.12, 加入了扩展章节 对于一个互联网企业,后端服务是必不可少的一个组成部分。抛开业务应用来说,往下的基础服务设施做到哪些才能够保证业务的稳定可靠、易维护、高可用呢?纵观整个互联网技术体系再结合公司的目前状况,个人认为必不可少或者非常关键的后端基础技术/设施如下图所示: ...

    文章 微wx笑 2018-01-15 1097浏览量

  • SpringCloud实战3-Hystrix请求熔断与服务降级

    我们知道大量请求会阻塞在Tomcat服务器上,影响其它整个服务.在复杂的分布式架构的应用程序有很多的依赖,都会不可避免地在某些时候失败.高并发的依赖失败时如果没有隔离措施,当前应用服务就有被拖垮的风险.Spring Cloud Netflix Hystrix就是隔离措施的一种实现,可以设置在某种超...

    文章 狂小白 2018-05-12 1307浏览量

  • 谈谈我对服务熔断、服务降级的理解

    伴随着微服务架构被宣传得如火如荼,一些概念也被推到了我们面前(管你接受不接受),其实大多数概念以前就有,但很少被提的这么频繁(现在好像不提及都不好意思交流了)。想起有人总结的一句话,微服务架构的特点就是:“一解释就懂,一问就不知,一讨论就吵架”。 其实对老外的总结能力一直特别崇拜,Kevin Ke...

    文章 developerguy 2017-01-24 3164浏览量

  • 《 软件测试价值提升之路》——3.2 正常使用中部分出错

    本节书摘来自华章出版社《软件测试价值提升之路》一书中的第3章,第3.2节,作者:杨晓慧编著,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.2 正常使用中部分出错 3.2.1 问题案例我们的产品中遇到的大部分客户问题都属于此类。例如:某产品的客户端是运行在浏览器上的,支持IE8、IE9...

    文章 华章计算机 2017-05-02 1650浏览量

  • 利用阿里云搭建WordPress网站 – 服务器横向扩展

    WordPress是一种非常流行的博客网站平台,也可以当作一个内容管理系统(CMS)来使用, 是世界上使用最广泛的博客系统之一。WordPress有非常多优秀的插件,使得这个开源产品变得非常容易扩展,满足不同的需求。我准备利用一个系列的文章,来展示如果利用阿里云的各种产品(弹性计算,数据库,安全等...

    文章 上云小马达 2019-10-08 3364浏览量

  • 美国36%流量背后 Netflix CDN分发算法优化

    文 / Mohit Vora, Andrew Berglund, Videsh Sadafal, David Pfitzner, and Ellen Livengood 译 / Ant,赵军  技术审校 / 扶凯 CDN的原理就是将用户想要的内容放在距他尽可能近的地方,以最低的成本获取。当面对...

    文章 livevideostack 2018-01-04 1400浏览量

  • 限流和降级(上) | 如何打造平台稳定性能力(一)

    在整个稳定性体系中,所包含的范围非常广泛,从机房的布线、网络通信、硬件部署、应用架构、数据容灾等方面都与之相关。从共享服务中台的角度看,则更多的是从应用架构设计和中间件平台的维度对平台的稳定性实现更精确化的管理和保障。本期开始,我们将从这个角度介绍阿里巴巴中间件团队多年来为了提升平台稳定性所做出的...

    文章 中间件小哥 2018-08-16 4300浏览量

  • 孙宇聪:来自Google的DevOps理念及实践

    经过数年蛰伏,DevOps成为了业界焦点,不过如何实现DevOps,依然路漫漫,本期文章转载自数人云组织的DevOps系列分享实录,了解并学习Google的DevOps实践 SRE(Site Reliability Engineering)是最早由Google提出,又经由Google发展完善的一...

    文章 行者武松 2017-08-01 1286浏览量

  • 一线架构师带你玩性能优化

    1.什么是系统优化 系统优化一个方面是系统化的对IT系统或交易链上的每个环节进行分析并优化,另一个是对单一系统进行瓶颈点分析和调优。但优化的目标大致相同,无非是提高系统的响应速度、吞吐量、降低各层耦合,以应对灵活对边的市场。 系统优化的3个层次:IT架构治理层、系统层、基础设施层。 IT系统治...

    文章 jurassic_1 2016-10-24 8397浏览量

  • 领英如何应对Apache Spark的Scalability挑战

    演讲嘉宾简介:沈旻,领英Spark团队软件工程师,技术负责人,伊利诺伊芝加哥分校计算机专业博士学位。林致远,领英Spark团队软件工程师,卡耐基梅隆大学硕士学位,专攻分布式系统方向。 以下内容根据演讲视频以及PPT整理而成。 点击链接观看精彩回放:https://developer.aliyun....

    文章 KB小秘书 2020-07-30 252浏览量

  • 孙宇聪:来自Google的DevOps理念及实践

    SRE(Site Reliability Engineering)是最早由Google提出,又经由Google发展完善的一个崭新运维理念。如今SRE已成为一个涵盖运维理念、思路、组织架构和具体实践的完整体系。数人云推出SRE系列教程,由SRE经验丰富的技术大牛们为大家分享运维一线的独家干货,揭示S...

    文章 技术小能手 2018-04-19 5215浏览量

  • 棋牌游戏DDoS防御细谈

    随着闲徕、皮皮等这一类新兴棋牌游戏公司的异军突起,今天整个行业都涌现出了大量的棋牌游戏公司。但游戏行业一直是竞争状态,尤其是棋牌行业是目前竞争、攻击最复杂的一个“江湖”。很多公司对这个行业不了解,贸然进行进入,并未对自身的系统、业务安全做很好的认知,存在很大的盲区,一旦被攻击束手无策,尤其是DDo...

    文章 亲君123 2018-01-04 2843浏览量

1 2 >

云产品推荐

阿里云大学 云服务器ECS com域名 网站域名whois查询 开发者平台 小程序定制 小程序开发 国内短信套餐包 开发者技术与产品 云数据库 图像识别 开发者问答 阿里云建站 阿里云备案 云市场 万网 阿里云帮助文档 免费套餐 开发者工具 企业信息查询 小程序开发制作 视频内容分析 企业网站制作 视频集锦 代理记账服务 企业建站模板