• 数据中心NFV技术可靠性研究

    对CMS、CNFM等管理系统同样采用备份、带外管理等机制,进一步提升系统可靠性。当通过这些一系列的软件得到故障原因后启动自动告警、自动切换等一系列措施,实现系统故障自愈,还需要支持在网络软硬件解耦后进行...
    文章 2017-08-01 1417浏览量
  • 疫情期,APP 崩了怎么办?阿里工程师公开高可用架构...

    除去因问题发现、容量规划、流控和熔断降级引起的“崩”,运维态的隐患问题如故障影响面、配置一致性、监控和根因分析相关工具、复杂的人员组织的高可用程度等,如果没有足够的演练和验证方案,一样会在关键时刻让...
    文章 2020-02-18 4675浏览量
  • 疫情期,APP 崩了怎么办?阿里工程师公开高可用架构...

    除去因问题发现、容量规划、流控和熔断降级引起的“崩”,运维态的隐患问题如故障影响面、配置一致性、监控和根因分析相关工具、复杂的人员组织的高可用程度等,如果没有足够的演练和验证方案,一样会在关键时刻让...
    文章 2020-02-18 5631浏览量
  • 利用SQL SERVER 2005数据库镜像实现可用性

    确保数据的完整:要求只要是用户提交到服务器上的数据,那怕说数据刚提交上主体服务器就发生故障了,也能保证数据不会丢失。故障转移之后的数据是不会丢失,从而保证数据库的完整性 高级别保护模式: 我们从名称上也...
    文章 2017-11-14 1181浏览量
  • WSFC基础知识奠基

    1.确保多个节点可以访问到相同内容的共享存储,不论是SAS,ISCSI,FCOE,JBOD,RBOD,或是SDS出来的都可以,确保同一个共享存储可以被所有群集内节点访问,以便发生故障转移时其它节点可以从共享存储上线资源 ...
    文章 2017-11-12 1388浏览量
  • 高效运维之员工的四大误区及解决之道

    如果出现重大故障,不要先假设自己负责的部分(如数据库)是没问题的,并着主观倾向去分析问题,这样在言语表达上可能让人反感,而且也往往不正确。另外,也不要觉得自己负责的这部分没问题,于是对发生的重大故障...
    文章 2016-06-09 3023浏览量
  • 21世纪了还愚公移山?数据库这么迁移更稳定!

    如上图,TDDL Sequence是基于数据库更新+内存分配:每次操作批量分配id,分配id的数量就是sequence的内步长,而原有id值就加上部长值,后续的分配直接就在内存里拿,这样的优势:简单高效 缺点:无法保证自增顺序...
    文章 2019-03-14 10710浏览量
  • 分布式系统,你真的了解吗?

    一般我们在写功能代码的时候,是不会考虑到硬件故障的时候应该怎么办的。而如果在编写分布式系统的时候,就一定需要面对这个问题了。否则,很可能只有一台服务器出故障,整个数百台服务器的集群都工作不正常了。除了...
    文章 2017-08-01 1177浏览量
  • 穆客你快速定位Node.js内存泄露

    应用性能管理(APM),是对企业系统即时监控以实现对应用程序性能管理故障管理的系统化的解决方案。APM的覆盖范围包括五个层次的实现:终端用户体验,应用架构映射,应用事务分析,深度应用诊断,和数据分析。总结...
    文章 2016-07-29 5769浏览量
  • UCS 刀片

    第一个FI上面的带外管理接口通过控制台能够获得一个IP地址,通过同样的子网络获得一个簇的IP地址。你所需要做的只是命名这个簇,设置管理员密码就可以了。第二个FI将会监测第一级设置,然后请求一个IP地址加入到系统...
    文章 2017-11-14 1141浏览量
  • 企业安全管理的“六脉神剑”

    实现带外访问控制设备,如串行端口和调制解调器,物理控制访问敏感设备和服务器。限制哪些管理员可以物理访问这些系统,或谁可以在控制台登录。不能因为雇员有行政地位,就意味着不能限制他或她的权力。审查管理员。...
    文章 2017-05-02 1384浏览量
  • 游戏运维编年史:可能是目前最详细游戏运维指南

    这样的信息只要是用来将来批量化部署、管理服务器使用,以及当出现故障时,运维可以很方便的查询相当的服务器以及服务信息。但是数据的及时性、准确性、可检查是一个难点。集中批量化管理 CMDB不是TXT文件,而是要...
    文章 2017-05-02 3283浏览量
  • 看看那些触目惊心的光伏质量安全问题

    光伏虽然是一个“新”的行业,但各种质量问题已经不容忽视:电器短路、停机、燃烧、热斑、隐裂、功率衰减组件负偏差、电站实地功率预测不准确、逆变器高故障率偏高等等,在一些地方是层出不穷。尤其是最近几年,中国...
    文章 2017-07-04 1351浏览量
  • 100个为什么让你了解分布式光伏发电

    29、如果电网停电或发生其他故障,分布式能正常运行吗?电网停电后,分布式光伏发电系统一般都会退出运行,不能正常发电,但在某些极端情况下可能会出现孤岛现象,即电网停电后分布式发电系统仍然着部分负荷继续...
    文章 2017-07-03 2448浏览量
  • 阿里云新品发布会周刊第112期 丨 空中架构师云速搭...

    减轻了工作量、提升开发工作效率的同时还能减少bug的发生 查看原文2、快速界定故障:Socket Tracer网络监控实践Socket Tracer定位是传输层(Socket&TCP)的指标采集工具,通过补齐网络监控的这部分盲区,来达到...
    文章 2021-08-06 170浏览量
  • Zookeeper概念学习系列之zookeeper是什么?

    如果我们每台机器里都备有一份域名到IP地址的映射,这个倒是能解决一部分问题,但是如果域名对应的IP发生变化了又该怎么办呢?于是我们有了DNS这个东西。我们只需要访问一个大家熟知的(known)的点,它就会告诉你这个...
    文章 2017-11-12 1475浏览量
  • Zookeeper概念学习系列之zookeeper是什么?

    如果我们每台机器里都备有一份域名到IP地址的映射,这个倒是能解决一部分问题,但是如果域名对应的IP发生变化了又该怎么办呢?于是我们有了DNS这个东西。我们只需要访问一个大家熟知的(known)的点,它就会告诉你这个...
    文章 2017-11-12 2438浏览量
  • 高效运维之运维2.0:危机前的自我拯救

    其中“专业”的意思,包括减少故障发生次数,缩短故障时长(有公司甚至进一步提出,“不以故障多为耻,以恢复快为荣”),少犯人为事故,个人技术进步服从业务要求(少搞自研、多用开源)等。另外,“热情、方便、快...
    文章 2016-06-10 3855浏览量
  • 高可用之2——存储b

    还要说明的地方是,在有些厂商和有些产品的概念里,lun id被绑定到了具体的device上,比如IBM的一些库,整个库只有一个target ID,然后changer、tape drive被分别分配为lun0、lun1、lun2…但是要注意到,这只是...
    文章 2012-06-02 1402浏览量
  • 阿里云数据库,破解大型网站架构设计中的数据存储难题

    除此之外,还需要保证发生误操作时数据库的稳定性,虽然MySQL有比较合理的权限管理机制,但是像新兴的MongoDB以及Redis等数据库对于权限管理的处理还是比较粗放的,而在权限管理不合理的情况下,如果触发了误操作将...
    文章 2017-04-19 7557浏览量
  • 开源监控利器nagios实战(一)

    发生故障的时候,维护网站的程序员能收到报警邮件和报警短信,而管理数据库管理员则无需收到这些报警,同时维护程序的用户可以以自己的帐号登陆监控服务器,通过web方式察看自己所管服务器的状态(只能看自己的而...
    文章 2017-11-16 1307浏览量
  • [QCon讲稿实录]谈高质量架构产品化输出

    尤其是去年发生了多起IDC故障,用户对高可靠系统架构的需求格外高。所以针对这种情况,我们又推出了EWS服务,目的让用户能够简单的获取高质量架构的能力。首先来看一下EWS 的业务架构,EWS的全称是Enterprise ...
    文章 2016-04-25 5366浏览量
  • 在家办公这些天整理的Kafka知识点大全

    Follower发生故障后会被临时提出LSR,待该follower恢复后,follower会读取本地的磁盘记录的上次的HW,并将该log文件高于HW的部分截取掉,从HW开始想leader进行同步,等该follower的LEO大于等于该Partition的hw,即...
    文章 2020-02-19 1169浏览量
  • 关系数据库如何工作

    对于知识渊博的您,本文或多或少分为 3 个部分:低级和高级数据库组件概述查询优化过程概述事务和缓冲池管理概述回归本源很久以前(在一个遥远的星系中……),开发人员必须确切地知道他们正在编码的操作数量。...
    文章 2022-06-29 12浏览量
  • Linux的启动流程(CentOS 6)

       Linux 系统的启动过程对于管理员来说是完全透明的,了解了Linux的启动过程,就好像有了透视眼一样,能够清楚的了解Linux的一切。知道了这些,不仅能够解决实际生产中的问题,更能够自己来制作Linux,自己定制...
    文章 2017-10-13 1955浏览量
  • Linux的启动流程(CentOS 6)

    Linux 系统的启动过程对于管理员来说是完全透明的,了解了Linux的启动过程,就好像有了透视眼一样,能够清楚的了解Linux的一切。知道了这些,不仅能够解决实际生产中的问题,更能够自己来制作Linux,自己定制Linux了...
    文章 2017-11-04 1089浏览量
  • Java后端开发三年的程序员竟然还被JVM难住!...

    分配⽅式有“指针碰撞”和“空闲列表”两种,选择那种分配⽅式由 Java 堆是否规整决定,⽽ Java 堆是否规整⼜由所采⽤的垃圾收集器是否有压缩整理功能决定。内存分配的两种⽅式:选择以上两种⽅式中的哪⼀种,取决...
    文章 2022-05-31 30浏览量
  • 搞懂分布式技术7:负载均衡概念与主流方案

    Bill 思考片刻,发现了漏洞:“这样做有个很要命的问题,由于DNS这个分层的系统中有缓存,用户端的机器也有缓存,如果某个机器出故障,域名解析仍然会返回那个出问题机器的IP,那所有访问该机器的用户都会出问题,...
    文章 2018-06-22 1944浏览量
  • 分布式事务及分布式系统一致性解决方案

    如果有些业务由于瞬时的网络故障或调用超时等问题,那么这种重试机制其实是非常有效的。当然,考虑个比较极端的场景,假如系统自身有bug或者程序逻辑有问题,那么重试1W次那也是无济于事的。那岂不是就发生了“明明...
    文章 2016-07-02 1432浏览量
  • TCP札记

    由于每一段链路的MTU都可能不同,因此分片可以发生在原始发送端主机上,也可以发生在中间路由器上。此外,已经分片过的数据报可能会再次进行分片以满足该段链路的MTU。IP首部中包含的数据为分片和重新组装提供了足够...
    文章 2017-11-16 1460浏览量
1 2 3 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化