• 关于

    次优控制系统常见故障

    的搜索结果
  • 超全总结|阿里如何应对电商故障?神秘演练细节曝光

    分布式系统常见依赖故障治理及技术演进 首先抛一个问题,什么情况下你会认为淘宝网挂了?我相信关注这个问题的人很多,不过能给出确切答案的人并不多。因为这个看似简单的问题,真要回答起来好像也不是那么容易。...

    文章 技术小能手 2017-06-19 3556浏览量

  • 阿里双11网络技术揭秘:百万级物理和虚拟网络设备的...

    当监控系统探知到一个具体故障正在发生时,就会调用修复模块来完成故障修复,并在发现故障和修复完成故障后推送一条信息告知用户情况。这个过程几乎不需要人为的干预。我们希望借助一个大脑全面评估当下稳定性的情况...

    文章 技术小能手 2018-01-05 4779浏览量

  • 基础设施助力双11(十):百万级物理和虚拟网络设备的...

    当监控系统探知到一个具体故障正在发生时,就会调用修复模块来完成故障修复,并在发现故障和修复完成故障后推送一条信息告知用户情况。这个过程几乎不需要人为的干预。我们希望借助一个大脑全面评估当下稳定性的情况...

    文章 初商 2019-07-31 845浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!

    广告

  • 130 秒揭秘 EDAS 3.0 如何平滑应对突发流量高峰,为您...

    作为一个交易核心链路新系统上线进行压测是必不可少的环节,这也体现了云上PTS的压测系统对于用户重要性,在压测过程中遇到问题我们需要进行一轮轮调,调过程中EDAS3.0的监控中心和日志中心起到了重要作用,将...

    文章 中间件小哥 2020-10-12 3641浏览量

  • 深入剖析数据库内核之事务的本质|附下一代分布式数据...

    计算机系统在其发展的历程中经历了多重要的事件&xff0c;而上个世纪 60 年代迎来一次重大变革&xff0c;为计算机系统带来了巨变&xff0c;自那之后&xff0c;计算机就开始以数字化的方式重塑整个世界的进程。这次变革就是...

    文章 荔子liqi 2021-07-28 1浏览量

  • 轻松应对双11,百万级物理和虚拟网络设备的网络智能化...

    当监控系统探知到一个具体故障正在发生时,就会调用修复模块来完成故障修复,并在发现故障和修复完成故障后推送一条信息告知用户情况。这个过程几乎不需要人为的干预。我们希望借助一个大脑全面评估当下稳定性的情况...

    文章 zengzengzeng 2017-12-14 1825浏览量

  • 一线架构师带你玩性能优化

    系统优化一个方面是系统化的对IT系统或交易链上的每个环节进行分析并优化,另一个是对单一系统进行瓶颈点分析和调。但优化的目标大致相同,无非是提高系统的响应速度、吞吐量、降低各层耦合,以应对灵活对边的市场...

    文章 jurassic_1 2016-10-24 8932浏览量

  • 云服务器 ECS 监控:监控ECS实例

    一般来说,在本地数据中心我们会对基础设施进行监控,其中包括对主机实例的监控,以便系统地和随时地了解资源使用情况和性能变化,在出现性能瓶颈的时候合理地调配资源,或者在发生故障时追溯原因等等。在阿里云上,...

    文章 琴瑟 2017-08-14 4652浏览量

  • 说说分布式文件存储系统

    常见的异常有节点宕机、网络异常、硬件故障等等,异常处理不恰当导致不可用和系统性能问题都有经历过,而对于分布式文件系统改如何处理遗产个,以及如何通过压力异常测试保证系统可用性等等,都是比较大的话题,在...

    文章 boxti 2017-08-02 2293浏览量

  • 云开雾散——阿里云工业大数据应用解决方案

    阿里云提供的方案基于对于大数据的分析,系统故障预测,监控预警系统还有工艺调,最后的预期提升了1.2%的良品率。下一个案例是新能源方面的。这个方案是阿里云提供给新能源行业的制造风力发电机的客户的,风力发电...

    文章 场景研读 2016-11-29 5658浏览量

  • 阿里沈询:分布式事务原理与实践

    计算机的这种特性引出了一个问题:当多个人去读、算、写操作时,如果不加访问控制系统势必会产生冲突。而事务相当于在读、算、写操作之外增加了同步的模块,进而保证只有一个线程进入事务当中,而其他线程不会进入...

    文章 场景研读 2017-02-04 24844浏览量

  • 云原生存储系列文章(一):云原生应用的基石

    存储系统的可用性定义了在系统故障情况下访问数据的能力,故障可以是由存储介质、传输、控制器或系统中的其他组件造成的。可用性定义系统故障时如何继续访问数据,以及在部分节点不可用时如何将对数据的访问重新路由...

    文章 创业头条-吴松 2020-07-24 341浏览量

  • Kerberos网络身份认证协议介绍及SMB文件系统对其的...

    在《阿里云SMB协议文件存储服务支持基于AD域的用户身份认证及权限访问控制介绍》中,我们介绍了文件系统的用户身份认证和访问权限控制的一些基本概念,以及阿里云SMB协议文件存储服务目前支持基于AD域系统的用户身份...

    文章 EmeraldCity 2019-12-07 3851浏览量

  • DevOps发布策略简介

    在开始讲述阿里的实践之前,我们先简单介绍下几种常见发布策略,以及它们适用的场景和缺点。一 常见发布策略1 停机发布停机发布会在发布以前关闭服务,停止用户访问,然后一次性的升级所有服务。这种发布策略的...

    文章 开发者小助手_LS 2021-07-06 3471浏览量

  • 钢铁行业解决方案

    目前在转炉炼 钢过程中,传统的控制方式是根据专家经验分批多投料及吹氧,难以实 现投料次数的有效控制以及终点的准确把握,最终影响了企业的效益。因 此,需要综合考虑工艺要求、节能、环保以及安全性等因素,...

    文章 游客odtksgtzd3acu 2021-03-09 184浏览量

  • 云原生存储系列文章(一):云原生应用的基石

    存储系统的可用性定义了在系统故障情况下访问数据的能力,故障可以是由存储介质、传输、控制器或系统中的其他组件造成的。可用性定义系统故障时如何继续访问数据,以及在部分节点不可用时如何将对数据的访问重新路由...

    文章 阿里巴巴云原生小助手 2020-06-12 660浏览量

  • 阿里巴巴DevOps实践指南(二十二)|发布策略

    在开始讲述阿里的实践之前,我们先简单介绍下几种常见发布策略,以及它们适用的场景和缺点。常见发布策略停机发布停机发布会在发布以前关闭服务,停止用户访问,然后一次性的升级所有服务。这种发布策略的发布频率...

    文章 开发者小助手 2021-07-06 173浏览量

  • 浅谈云原生架构的 7 个原则

    面对这样的挑战,在传统架构中,通常是开发人员、运维人员疲于调优系统性能,但是,即使他们使出浑身解数,也未必能够完全解决系统的瓶颈问题,最终因系统无法应对不断涌入的海量用户而造成应用瘫痪。​除了面临业务...

    文章 阿里巴巴云原生小助手 2021-07-16 4166浏览量

  • 飞天5K实战经验:大规模分布式系统运维实践

    目前华佗系统已具备自动处理基本硬件和服务异常等常见问题的闭环处理能力,并且还在持续完善当中(具体可参阅《走近华佗,解析自动化故障处理系统背后的秘密》一文)。大规模与精细化的平衡 当运维的服务器达到数千...

    文章 yq传送门 2016-12-18 4651浏览量

  • 动静内容混合站点,怎样用全站加速支持实际业务场景?

    拥塞有不同类型:网络上的拥塞、节点因为突发流量很大造成的拥塞等等,解决这些问题的核心的理念就是多径重试,在选路的时候,最优、次优、再次的路径选择若干条,实际传输的时候优先选择最优路径,当最优路径出现...

    文章 樰篱 2018-05-31 4086浏览量

  • 带你读《HikariCP数据库连接池实战》之一:阿里中间件...

    这个例子是我在阿里巴巴多年间对一款中间件调的真实经历,这款中间件经历过很多打磨,比如全链路压测、3年双十一大促、多种监控系统接入、数整体结构重构改造、重大问题修复等。这款中间件是纯TCP的,再回首,我...

    文章 被纵养的懒猫 2019-11-08 1739浏览量

  • BAT解密:互联网技术发展之路(7)-网络层技术剖析

    停电和机房空调或者网络坏掉这种事故,运气好一年一两,运气不好一年5、6;水灾导致的停电在东南沿海几乎年年有,2013年汕头水灾导致整个机房被水淹了。所以机房故障要作为我们设计必须考虑的一个因素。多机房...

    文章 华仔爱技术 2015-11-11 2536浏览量

  • 《DNS稳定保障系列3-快如闪电,域名解析秒级生效》

    对于用户来说,大量线上服务和异地多活系统的构建是通过DNS来支撑的,更快的解析生效速度意味着更强的系统掌控能力和故障恢复能力,是系统稳定性和容灾能力评估的重要一环。让我从多个维度带您了解快速生效这个热点...

    文章 阿里云DNS专家 2019-11-12 3772浏览量

  • 谈谈互联网后端基础设施

    后者的方案则是很常见的流量控制和服务降级。具体的可以看美团技术团队总结的这篇文章:Cache应用中的服务过载案例研究。数据库 数据库是后端开发中非常常见的一个服务组件。对于数据库的选型,要根据业务的特点和...

    文章 jurassic_1 2016-12-09 5020浏览量

  • Service Mesh 高可用在企业级生产中的实践

    常见系统不可用因素包括:程序和配置出 bug、机器故障、机房故障、容量不足、依赖服务出现响应超时等。高可用的抓手包括:研发质量、测试质量、变更管理、监控告警、故障预案、容量规划、放火盲测、值班巡检等。...

    文章 花肉酱 2020-06-03 220浏览量

  • 谈谈互联网后端基础设施

    后者的方案则是很常见的流量控制和服务降级。具体的可以看美团技术团队总结的这篇文章:Cache应用中的服务过载案例研究。数据库 数据库是后端开发中非常常见的一个服务组件。对于数据库的选型,要根据业务的特点和...

    文章 微wx笑 2018-01-15 1259浏览量

  • 从运维和SRE角度看监控分析平台建设

    又是一笔额外的代价运维成本:各系统的软硬件难免会出故障&xff0c;硬件替换、缩扩容、软件版本升级&xff0c;也需要投入不小的人力和精力费用分摊&xff1a;只有地将资源消耗清晰准确分摊到实际业务线&xff0c;运维和SRE&xff0c...

    文章 suntingtao 2021-06-11 209浏览量

  • Oracle迁移到MySQL性能下降的注意点

    背景:最近有较多的客户系统由原来由Oracle改造到MySQL后出现了性能问题CPU 100%,或是后台的CRM系统复杂SQL在业务高峰的时候出现堆积导致业务故障。在我的记忆里面淘宝最初从Oracle迁移到MySQL期间也遇到了很多SQL...

    文章 玄惭 2017-03-20 5213浏览量

  • 系统自动重启的几大原因及解决办法

    2、打开控制面板-性能和维护-管理工具-服务-名称“Remote Procedure Call(RPC)”及Remote Procedure Call(RPC)Locator双击-属性窗口-恢复-设置每一次失败不操作,设置每二失败不操作,后续失败不操作。OK了吧?3,...

    文章 技术小甜 2017-11-16 1241浏览量

  • 车联网上云最佳实践(二)

    当前在传统IDC机房中应用的最前端是一台防火墙,用来防御一些常见的攻击和访问控制的操作。因为防火墙并不是什么高端防火墙所以防御能力有限。因公司业务快速发展,期间已经更换过2防火墙,分别是用户规模在10万和...

    文章 zkw9527 2018-08-22 2534浏览量

1 2 3 4 5 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化