• 块存储支持化618实战总结

    传统物理机发生故障或上下线时,只能依赖上层应用保证迁移和逃逸。通过虚拟化及网络+存储等底层设施全链路支持,ECS 可以提供虚拟机在线迁移功能,在传统 IDC 无解的故障场景下,提供了高效的逃生手段。5.磁盘热...
    文章 2019-10-09 1352浏览量
  • 阿里网络双十一的定海神针-智能网络平台齐天

    网络当中故障随时可能会发生,一台设备的故障,一根线路的异常,甚至一个端口的问题,都有可能导致网络故障的发生,而一旦网络发生故障,引起的蝴蝶效应则是大面积的上层业务和应用出现问题。很明显,双11期间我们是...
    文章 2019-11-20 4167浏览量
  • 数据中心NFV技术可靠性研究

    不过,运营商需要的是高可靠性的网络,对网络可靠性要求最高,但看看我们应用了虚拟化技术的表现,2015年十大计算宕机的收入损失超过了31 Million美元,显然这样的技术无法满足运营商的可靠性要求。运营商当然不...
    文章 2017-08-01 1438浏览量
  • 年轻人不讲武德,偷袭阿里的机房

    总会有各种原因和各种理由让一台服务器发生故障的,可能是过载了,可能是老鼠咬线了,可能是冷凝液泄露了,甚至可能是被知乎用户派人炸了。知乎上有人问过一个问题,如果阿里数据中心崩了或者被人炸了,是不是淘宝...
    文章 2020-11-18 10840浏览量
  • 【内含福利】专访阿里数据库备份专家 教你pick最有效...

    首先实时备份已经成为企业选择数据库备份方案的必选项,将故障发生时丢失数据量降到最小,其次快速恢复对核心数据库价值越来越明显,根据故障风险,选择最佳的恢复方案,最后整个备份恢复系统要定期演练,可以抽样...
    文章 2018-08-10 3129浏览量
  • 给运维做运维:我们是怎么从苦逼到流弊的?

    作为计算的开发者,底下无非就是虚拟化技术等,没接触计算的同学可能就不太了解了,希望通过我的讲解让大家知道计算的底层是怎样支撑业务的,我们又在底层做什么,怎么样帮助运维提高服务可用性。概要 今天我...
    文章 2017-11-15 2286浏览量
  • 你们看尽世界杯的快乐忧伤,他们负责稳定流畅

    比如,信号源出现故障怎么办,运营商网络出现故障怎么办。在十几天的时间里,阿里视频云和优酷一起进行了不下五次的凌晨演练,他们要将各种意外情况发生的概率降到最低。“其实刚开始的时候压力还是很大的。很多...
    文章 2018-07-09 1749浏览量
  • 阿里双11访谈之数据库

    这也的阿里云技术团队技术开创和引的工作作风有很大的关系。阿里云不仅把自己的技术分享给大家,还自己创建开源社区。大家可以关注我们的开源社区关注我们的技术发展。我们的产品形态也非常丰富,我们的安全机制有...
    文章 2017-11-01 6928浏览量
  • 规模化落地原生,阿里即将重磅亮相 KubeCon China

    演讲人阿里容器平台技术专家 熊欢(宁拙)议题简介在时代,企业中基于容器的应用激增,由于人工操作、硬件故障等,发生容器故障的可能性大幅增加。因此,如何在不增加资源投入的情况下保证大规模容器的可靠性...
    文章 2019-06-12 2621浏览量
  • 疫情期,APP 崩了怎么办?阿里工程师公开高可用架构...

    AHAS 的故障演练模块遵循混沌工程实验原理并融合了阿里巴巴内部实践的经验,基于此用户可以建立流程完整而且可视化程度很高的故障演练体系,可方便的对基础资源、应用服务、容器服务和平台4层进行超多维度的编排和...
    文章 2020-02-18 4694浏览量
  • 规模化落地原生,阿里即将重磅亮相 KubeCon China

    议题简介在时代,企业中基于容器的应用激增,由于人工操作、硬件故障等,发生容器故障的可能性大幅增加。因此,如何在不增加资源投入的情况下保证大规模容器的可靠性成为平台面临的一个巨大挑战。阿里巴巴运行着...
    文章 2019-06-12 11709浏览量
  • 【合集】规模化落地原生,阿里亮相 KubeCon China...

    时代,企业中基于容器的应用激增,由于人工操作、硬件故障等,发生容器故障的可能性大幅增加。因此,如何在不增加资源投入的情况下保证大规模容器的可靠性成为平台面临的一个巨大挑战。阿里巴巴运行着数百万个...
    文章 2019-06-24 11296浏览量
  • DTCC 2019|时代数据库迁移&容灾技术新进展与应用

    容灾,厂商如何通过新的技术实现弯道超车,本文中阿里智能数据库产品事业部高级技术专家付大超就为大家分享了阿里在此领域的技术新进展和应用。专家简介:付大超(花名:千震),阿里智能数据库产品事业部...
    文章 2019-05-24 3387浏览量
  • 疫情期,APP 崩了怎么办?阿里工程师公开高可用架构...

    AHAS 的故障演练模块遵循混沌工程实验原理并融合了阿里巴巴内部实践的经验,基于此用户可以建立流程完整而且可视化程度很高的故障演练体系,可方便的对基础资源、应用服务、容器服务和平台4层进行超多维度的编排和...
    文章 2020-02-18 5772浏览量
  • 阿里云技术战略总监陈绪:5G时代哪些核心技术值得关注...

    阿里云技术战略总监-陈绪博士为大家讲解了公共云降低IT成本的奥秘以及云计算面向5G/IoT的趋势。其中包括传统意义降低成本,永不停机的计算服务降低成本,公共云降低成本,还阐述了5G时代会发生什么和5G值得关注的...
    文章 2019-07-29 2538浏览量
  • 大华许焰:视频让数据价值视频能力发挥更完整

    原数据还是有可能发生故障我们考虑这种状况的时候,我们存储发生原数据故障退到NaaS数据,原数据恢复之后我们数据可以迁移到存储进行分散存储,这是取巧的做法但的确满足我们这种运用。我们整个互联网领域我们...
    文章 2017-09-06 2731浏览量
  • 阿里新品发布会周刊第112期 丨 空中架构师云速搭...

    减轻了工作量、提升开发工作效率的同时还能减少bug的发生 查看原文2、快速界定故障:Socket Tracer网络监控实践Socket Tracer定位是传输层(Socket&TCP)的指标采集工具,通过补齐网络监控的这部分盲区,来达到...
    文章 2021-08-06 205浏览量
  • 再流弊的技术,也抵不过一次事故:兼谈技术管理

    近期获悉的一些大故障,不仅来自于携程、阿里,还有一些影响范围不是很大,但同样非常不应该的人为事故。901阿里云故障 阿里称因云盾升级触发bug,导致部分服务器的少量文件被系统误隔离。其已第一时间启动系统...
    文章 2017-08-15 1725浏览量
  • 舞动的桥 阿里首个百万IOPS盘的背后

    CPU也可能存在一些偶发性的错误,如果压缩时发生这类小概率的偶发性错误,该怎么办呢?但户数据是绝对不能错的,所以我们这里采取防御性编程,压缩完后立即解压,再和原始内容比对,确保数据不错。PAXOS 说到分布式...
    文章 2018-02-01 4145浏览量
  • 超融合架构如何抹平物理硬件差异?

    每一个技术的选择与应用,都经过了UnitedStack有的思考和优化。以统一存储为例,通过将Ceph统一作为Nova/Glance/Cinder的存储后端,基于COW的卷创建和快照操作,实现了虚机的秒级创建。同时提供全SSD的Ceph存储,...
    文章 2017-08-02 1297浏览量
  • 使用存储即服务优化混合平台

    如果内部私有部分发生故障,那么用户可以将整个工作负载都迁移至公共且不会丢失服务。这就为用户提供了两个数据管理选项。一个是将主要数据部署在企业内部,然后将数据连续复制至公共。在爆发过程中,将数据...
    文章 2017-08-02 1259浏览量
  • 开发者社区精选直播合集(三)|企业级安全架构

    5.随时发生的系统故障&xff0c;防不胜防的勒索病毒&xff0c;人为或者误操作带来的运维事故&xff0c;还有不可预知的自然灾害&xff0c;数据的丢失损坏都会对业务造成难以估量的损失&xff0c;通过上与本地数据统一备份做到...
    文章 2021-07-20 707浏览量
  • 使用存储即服务优化混合平台

    如果内部私有部分发生故障,那么用户可以将整个工作负载都迁移至公共且不会丢失服务。这就为用户提供了两个数据管理选项。一个是将主要数据部署在企业内部,然后将数据连续复制至公共。在爆发过程中,将数据...
    文章 2017-10-02 799浏览量
  • 计算-从基础到应用架构系列-计算的概念,互联网...

    对这些存储服务器进行统一的管理,实现异地的分布式备份服务器机制,当我们的某一个服务器发生故障时,其他服务器可以接替故障服务器的任务继续进行服务,这是一种形式,还有就是通过分布式管理器,完成所有的存储...
    文章 1970-01-01 1548浏览量
  • 考拉上“”的431天:经历了怎样的“脱胎换骨”?

    在同个城市部署两个数据中心的好处在于,可以在一个数据中心发生故障或灾难的情况下,实现用户的“故障无感知”。考拉曾在2019年做过一套方案,发现建设这个能力需要8个月,成本高达上千万元。阿里早已尝试过“同城...
    文章 2020-12-03 510浏览量
  • 计算-从基础到应用架构系列-计算的概念

    服务器,有一个分布式的资源管理器,对这些存储服务器进行统一的管理,实现异地的分布式备份服务器机制,当我们的某一个服务器发生故障时,其 他服务器可以接替故障服务器的任务继续进行服务,这是一种形式,还有...
    文章 2017-11-12 1583浏览量
  • 计算-从基础到应用架构系列-计算的概念

    服务器,有一个分布式的资源管理器,对这些存储服务器进行统一的管理,实现异地的分布式备份服务器机制,当我们的某一个服务器发生故障时,其 他服务器可以接替故障服务器的任务继续进行服务,这是一种形式,还有...
    文章 2017-12-19 1632浏览量
  • 传统企业数据库上云案例分享

    但是从节点势必会引起延迟,当主节点发生故障的时候,这个时候不知道从节点的数据是不是最新的,因此如果切换从节点,很有可能会造成数据的丢失。为了解决这个问题,MySQL官方提供了另一种方式,半同步复制。半同步...
    文章 2018-05-30 3088浏览量
  • 阿里服务器购买前应该注意哪些事项?

    服务器(包年包月)支持在线自定义升级,升级是无缝的,您不需要重新部署环境或迁移数据,IP也不会发生变化。操作非常简单,通过控制台即可完成升级,您只需根据升级时长补差价即可。a)服务器支持在线升级CPU、...
    文章 2019-12-18 4046浏览量
  • 双11幕后超级英雄:新一代运维的价值

    智能时代的运维不是要让运维人员失业,而是对运维效率的提高有着极大的诉求,比如如何在错综复杂的环境中快速定位问题、root cause、甚至是故障预测,避免发生故障,保障应用稳定性。智能运维要借助数据(运维数据)和...
    文章 2017-11-15 4808浏览量
1 2 3 4 ... 9 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化