• 关于

    分布式应用故障原因

    的搜索结果
  • (四):C++分布式实时应用框架——状态中心模块

    C++分布式实时应用框架——状态中心模块   上篇:(三):C++分布式实时应用框架——系统管理模块     技术交流合作QQ群:436466587 欢迎讨论交流     版权声明:本文版权及所用技术归属smartguys团队所有,对于抄袭,非经同意转载等行为保留法律追究的权利!     状态中心...

    文章 smartguys 2017-12-14 1061浏览量

  • 一文读懂分布式架构知识体系(内含超全核心知识大图)

    点击图片或戳我查看详情和投简历作者 | 晓土  阿里巴巴高级工程师 姊妹篇阅读推荐:《云原生时代,分布式系统设计必备知识图谱(内含22个知识点)》 导读:本文力求从分布式基础理论、架构设计模式、工程应用、部署运维、业界方案这几大方面,介绍基于 MSA(微服务架构)的分布式知识体系大纲,从而对 SO...

    文章 阿里巴巴云原生小助手 2019-10-16 5054浏览量

  • 应用性能的金刚伏魔圈

    小说倚天屠龙记中少林寺的渡厄、渡难、渡劫三位大师的金刚伏魔圈曾经让不可一世的明教教主张无忌也讨不到半分好处。在应用性能领域,也有一个金刚伏魔圈,那就是由ARMS、AHAS、PTS三个阿里云服务打造的应用性能核心防御圈。三个服务中只有ARMS的知名度相对高一些,原因可能是ARMS所对应的APM(应用...

    文章 anxin 2021-02-13 116浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!

    广告

  • 架构设计 | 分布式体系下,服务分层监控策略

    一、分布式故障 分布式系统的架构,业务开发,这些在良好的思路和设计文档规范之下,是相对来说好处理的,这里的相对是指比较分布式架构下生产环境的突然故障。 在实际的开发中,有这样一个很妖娆的情况:越是核心复杂的业务,越是担心出问题,越容易出问题。 所以当核心服务的链路出现故障时,如何快速定位问题就是...

    文章 知了一笑 2020-09-17 358浏览量

  • 我们雇佣了一只大猴子...

    Picture from Gremlin 我们“雇佣”了一只大猴子,只为“搞破坏”,不开玩笑。 这只猴子是用来做什么的? 从程序员的视角来看,提高系统稳定性的方法无外乎三种: 通过各种技术手段,例如在容器和调度、微服务、消息、软负载和配置中心等纬度提高系统和架构的健壮性; 提升监控的广度和深...

    文章 中间件小哥 2019-02-28 1892浏览量

  • 区块链是个生态:2018区块链生态技大会参会随想

    区块链是个生态:2018区块链生态技大会参会随想 上周末参加了由InfoQ主办的BCCon2018全球区块链生态技术大会,按照惯例做个参会总结。 本次演讲嘉宾基本上都是一线的区块链技术负责人或者管理者,内容从技术原理和应用实践出发,展现出了当前国内区块链技术和应用实践的总体水平。另外一面,本次参会...

    文章 正鹏 2018-08-30 1005浏览量

  • 五分钟了解一致性的分类及其理论

    1、强一致性 这种一致性级别是最符合用户直觉的,它要求系统写入什么,读出来的也会是什么,用户体验好,但实现起来往往对系统的性能影响大。 2、弱一致性 这种一致性级别约束了系统在写入成功后,不承诺立即可以读到写入的值,也不久承诺多久之后数据能够达到一致,但会尽可能地保证到某个时间级别(比如秒级别)后...

    文章 colincheng 2017-03-27 736浏览量

  • 分布式系统简介

      研究生阶段学习的分布式原理与泛型几乎忘完了,当初不怎么懂。。。现在工作中发现大数据技术的底层还是分布式系统,那么重新拾起,总结下~ 一、分布式系统简介   分布式系统是若干独立计算机的集合,这些计算机对于用户来说就像是单个相关系统。这个定义包含了两方面的内容,第一方面是硬件的:机器本身是独立的...

    文章 松伯 2016-06-10 614浏览量

  • 《分布式系统:概念与设计》一1.5 挑战

    1.5 挑战 1.2节的例子试图说明分布式系统的范围,并提出在设计中出现的问题。在许多系统中,遇到了重大的挑战并且已经得到解决。随着分布式系统的应用范围和规模的扩展,可能会遇到相同的和其他的挑战。本节我们描述主要的挑战。 1.5.1 异构性 互联网使得用户能在大量异构计算机和网络上访问服务和运行应...

    文章 华章计算机 2017-08-01 1053浏览量

  • 《大型网站系统与Java中间件》读书笔记(上)

    前言 只有光头才能变强。 文本已收录至我的GitHub仓库,欢迎Star:https://github.com/ZhongFuCheng3y/3y 这本书买了一段时间了,之前在杭州没带过去,现在读完第三章,来做做笔记 这本书前三章都在科普和回顾中间件/分布式的基础,讲得非常通俗易懂。在之前已...

    文章 java3y 2019-06-10 4839浏览量

  • 超全总结 | 阿里如何应对电商故障?神秘演练细节曝光

    近日,在 QCon北京2017大会上,来自阿里巴巴中间件团队的技术专家周洋(花名中亭)发表了题为《阿里电商故障治理和故障演练实践》专题演讲。在会后官方组织的评选中,本次演讲的内容得到了一致好评,中亭获选为本次大会的明星讲师。此次演讲整体上分享了从 2011 年至今,阿里巴巴电商平台遇到的诸多有代表...

    文章 技术小能手 2017-06-19 3471浏览量

  • 架构选型必读:集中式与分布式全方位优劣对比

    应用现状比较 由于历史原因,集中式架构多用于传统银行、电信等行业。主机资源集中在大型主机或小型机上。集中式架构下,包括操作系统、中间件、数据库等“基础软件” 均为闭源商用系统。集中式架构的典型案例是 IOE(IBM、 Oracle、EMC)提供的计算设备、数据库技术和存储设备共同组成的系统。 近年...

    文章 技术小能手 2018-06-15 2960浏览量

  • 车联网上云最佳实践(二)

    第一篇内容:《车联网上云最佳实践(一)》 二、传统IDC架构介绍及技术详解 俗话说知己知彼百战不殆,我们要上云首先要充分了解自己业务和应用架构。然后在充分了解云上产品的特性,看看哪些产品可以直接被我们使用,哪些是需要我们的应用或架构做出调整的。下面我们来分析下智能车联网平台的相关架构。   1、...

    文章 zkw9527 2018-08-22 2499浏览量

  • 《分布式系统:概念与设计》一2.4.2 故障模型

    2.4.2 故障模型 在分布式系统中,进程和通信通道都有可能出故障,即它们可能偏离被认为是正确或所期望的行为。故障模型定义了故障可能发生的方式,以便理解故障所产生的影响。Hadzilacos和Toueg[1994]提供了一种分类法,用于区分进程故障和通信通道故障。这些故障将分别在下面的“遗漏故障”...

    文章 华章计算机 2017-08-01 957浏览量

  • 构建大数据网络 需要重视这五个地方

    在人们考虑大数据时,人们留意到了“大”这一个字,可是在投建基础架构时,人们还应当留意“分布式”。 实际上,大数据的应用程序需要处理大量信息,并且在出自弹性的考虑将数据拷贝到多个部位时,信息的规模变得越来越大。可是,大数据的最关键属性并非在于它的规模,而在于它将大作业切分成很多小作业的能力,它才能将...

    文章 梦蝶数据 2019-04-16 755浏览量

  • 高性能Web应用的六个好习惯

      为了提供与你的业务目标一致的的服务,管理你的Web应用程序是非常重要的。CA公司副总裁Prabhjot Singh讨论了企业应该发展的6个好习惯,以便提供高Web应用程序的性能。   在迅速发展的Web应用程序服务环境中,业务事务处理要很好地传送。这些业务事务处理通过网络、应用服务器、防火墙和...

    文章 lzhdim 2009-02-12 652浏览量

  • 《云数据管理:挑战与机遇》2.3.3 恢复和提交

    本节书摘来自华章出版社《云数据管理》一书中的第2章,第3节,作者迪卫艾肯特·阿格拉沃尔,更多章节内容可以访问云栖社区“华章计算机”公众号查看  恢复和提交 集中式恢复 故障恢复是数据库管理系统不可分割的一部分。集中式恢复可以在单站点数据库在磁盘上存储所有数据时确保其持久性或永久性。为了在确保原...

    文章 华章计算机 2017-05-19 1252浏览量

  • 阿里云服务网格ASM之扩展能力(4):在ASM中实现分布式跟踪

    本系列文章讲讲述阿里云服务网格ASM的一些扩展能力: 阿里云服务网格ASM之扩展能力(1):在ASM中通过EnvoyFilter添加HTTP请求头 阿里云服务网格ASM之扩展能力(2):在ASM中支持自定义外部授权 阿里云服务网格ASM之扩展能力(3):在ASM中使用开放策略代理OPA 阿里云服...

    文章 osswangxining 2020-03-10 419浏览量

  • ENode 1.0 - 框架的物理部署思路

    开源地址:https://github.com/tangxuehua/enode 上一篇文章,介绍了enode框架的总体目标,以及如何实现高吞吐、低延迟、高可用、无单点问题的实现思路。本篇文章,我们再分析一下其他一些需要考虑的问题。我发现写文章挺累的,费时费脑经,但我会坚持下去。本文主要分析一下e...

    文章 netfocus 2016-05-27 1279浏览量

  • ChaosBlade x SkyWalking 微服务高可用实践

    来源|阿里巴巴云原生公众号 前言 在分布式系统架构下,服务组件繁多且服务间的依赖错综复杂,很难评估单个故障对整个系统的影响,而且请求链路长,如果监控告警、日志记录等基础服务不完善会造成故障响应、故障定位问题难,所以如何构建一个高可用的分布式系统面临着很大挑战。混沌工程就此产生,在可控范围或环境下通...

    文章 阿里巴巴云原生小助手 2020-12-09 9417浏览量

  • 根本原因分析 关键事件关联 IT运维有序发展——中国联通通讯集团

    ·案例背景    中国联通经过几年的信息化建设,已经建成了统一信息平台Portal、BPM、OA等多个应用系统。企业各个业务所需要的应用系统,极大地提升了企业的信息化水平,提高了工作效率,基本实现了无纸化办公。 随着应用系统越来越多、越来越深入,员工的日常工作已离不开这些应用系统,应用系统的运行状...

    文章 技术小美 2017-11-09 1478浏览量

  • DevOps:软件架构师行动指南2.2 云的特性

    2.2 云的特性 云最根本的推动者是构筑在成千上万通过因特网访问的主机之上的虚拟化技术。我们首先探讨以IaaS为中心的特性,即虚拟化和IP管理,接着是PaaS提供的一些特性。然后,我们探讨一些普遍的问题,例如数以万计的主机所带来的后果,以及云是如何支持弹性的。 2.2.1 虚拟化 在云计算中,虚...

    文章 华章计算机 2017-05-02 1723浏览量

  • 一行代码,保障分布式事务一致性—GTS:微服务架构下分布式事务解决方案

    【GTS直播火热报名中,直播直通车】 微服务倡导将复杂的单体应用拆分为若干个功能简单的、松耦合的服务,这样可以降低开发难度、增强扩展性、便于敏捷开发。概念2012年提出迅速火遍全球,被越来越多的开发者推崇,很多互联网行业巨头、开源社区等都开始了微服务的讨论和实践。根据Netflix云架构总监Adr...

    文章 中间件小哥 2018-05-21 6156浏览量

  • 《ZooKeeper:分布式过程协同技术详解》——第1章 简介1.1 ZooKeeper的使命

    本节书摘来自华章计算机《ZooKeeper:分布式过程协同技术详解》一书中的第1章,第1.1节,作者:Flavio Junqueira, Benjamin Reed 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 第一部分 ZooKeeper的概念和基础这一部分适合任何对ZooKeeper...

    文章 华章计算机 2017-05-02 1158浏览量

  • OceanBase 首席架构师:关系数据库到三代分布式数据库,我亲历的数据库演进史

    本文嘉宾:杨传辉(花名:日照),蚂蚁集团研究员,OceanBase 创始成员和首席架构师。主导了 OceanBase 技术架构设计,实现分布式数据库在核心金融场景零的突破。同时,他也主导...

    文章 荔子liqi 2021-04-22 82浏览量

  • 万亿级数据洪峰下的分布式消息引擎

    前言 通过简单回顾阿里中间件(Aliware)消息引擎的发展史,本文开篇于双11消息引擎面临的低延迟挑战,通过经典的应用场景阐述可能会面临的问题 - 响应慢,雪崩,用户体验差,继而交易下跌。为了应对这些不可控的洪峰数据,中间件团队通过大量研究和实践,推出了低延迟高可用解决方案,在分布式存储领域具有...

    文章 中间件小哥 2017-02-07 6853浏览量

  • 阿里如何做到百万量级硬件故障自愈?

    随着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务之前实现硬件故障自动闭环策略,对于常见的硬件故障无需人工干预...

    文章 隐林 2018-11-24 3341浏览量

  • 阿里如何做到百万量级硬件故障自愈?

    随着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务之前实现硬件故障自动闭环策略,对于常见的硬件故障无需人工干预...

    文章 技术小能手 2018-11-19 2729浏览量

  • 还不懂HDFS的工作原理?快来扫扫盲

    Hadoop分布式文件系统(HDFS)是一种被设计成适合运行在通用硬件上的分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的 机器上。它能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。要理解HDFS的内部工作原理,首先要理解什么是分布式文件系统。 1、分布式文件系统 多台计...

    文章 知与谁同 2017-08-01 762浏览量

  • CIO:互联网IT系统和传统企业IT系统的异同

    打个比方,原先的大型企业系统架构,就好像一架大型的民航客机。作为出行来讲,飞机无疑是最舒适最快的交通工具,同时安全性也很好。但飞机却也不是人人都能坐的。首先:做飞机要经过换领登机牌,安检等若干道手续,乘客必须提前一个多小时到机场办理各种手续,而坐火车大巴则随到随买随上车,方便的多;其次:坐飞机很多...

    文章 玄学酱 2017-07-07 1156浏览量

1 2 3 4 ... 37 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化