• 关于

    识别与控制发生故障怎么办

    的搜索结果
  • 走近华佗,解析自动化故障处理系统背后的秘密

    MaxCompute:阿里云数加-大数据计算服务,华佗用MaxCompute进行大规模系统和故障的数据挖掘,用以提高故障检测准确率和预测故障发生。阿里云数加-大数据计算服务MaxCompute产品地址:...

    文章 yq传送门 2016-12-18 4584浏览量

  • 蚂蚁金服冯柯:下一个十年,核心自研技术将迎来黄金...

    因此,在两地三中心的架构下,如果真的发生城市级故障,我们通常也不敢把业务切到灾备中心,只能等待故障的数据中心恢复,在这个过程中,系统是无法提供服务的。两地三中心的本质是同一城市内跨数据中心的扩展性和...

    文章 兔子酱 2018-05-15 2515浏览量

  • 蚂蚁金服冯柯:下一个十年,核心自研技术将迎来黄金...

    因此,在两地三中心的架构下,如果真的发生城市级故障,我们通常也不敢把业务切到灾备中心,只能等待故障的数据中心恢复,在这个过程中,系统是无法提供服务的。两地三中心的本质是同一城市内跨数据中心的扩展性和...

    文章 阿里云头条 2018-05-15 1482浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!

    广告

  • 【活动精彩回顾】搜索&推荐技术分享沙龙电商专场(附...

    外部调用推荐系统可使用API进行结果的获取,对于控制台已支持的功能,包括创建打散规则、设置曝光过滤时间、设置混排规则、查询用户/物品数据/更新记录等均可使用提供的API接口调用。目前暂时不支持模型内(包括召回...

    文章 工程师乙 2020-01-19 1511浏览量

  • 【智驾深谈】特斯拉死亡事故官方洗白,业界被判死缓...

    2016年5月7日,美国佛罗里达州威利斯顿西部,一辆2015年的特斯拉 Model S 在高速路上通过一个十字路口时,失控地一辆货柜车发生碰撞,导致特斯拉司机死亡。从失事的 Model S 上获得的数据显示:1)发生碰撞时,该...

    文章 知与谁同 2017-08-01 1065浏览量

  • 0X0000007b

    如果该设备驱动程序已被损坏或与控制器不兼容,则 可替换该驱动程序,方法是将新驱动程序复制到%systemroot%system32drivers 文件夹下,或通过紧急修复 过程进行替换。要成功启动在 scsi 控制器或启用 atapi 的...

    文章 科技小能手 2017-11-12 1044浏览量

  • 企业安全管理的“六脉神剑”

    信息系统审计与控制协会(ISACA)从事开发、采纳和使用全球公认的,业界领先的知识和实践信息系统,如COBIT标准和CISA认证信息系统。对于已确定的各项资产,你必须为执行建议的保护措施负责。安全专业人员所遇到的问题...

    文章 小旋风柴进 2017-05-02 1189浏览量

  • 信息系统项目管理01——信息化和信息系统

    (2)MMTR——平均维护时间,可维护性用此度量,这是系统发生故障后维修和恢复正常花费的平均时间。1.4 软件工程 1 需求 1 好的需求应该具有无二义性、完整性、一致性、可测试性、确定性、可跟踪性、正确性、必要性...

    文章 阿墨呦 2020-12-11 101浏览量

  • 如何做好一名稳定性SRE-业务团队系统稳定性的思

    自助是让你的客户自己动手,通过提供机器人,自动识别订单类型,自动排查订单状态和节点,自动告知服务规则特征,自动匹配问题类型给出排查结果或排查过程等。Google SRE设置了一个50%的上限值,要求SRE人员最多只在...

    文章 茶什i 2020-10-26 3262浏览量

  • 规模化落地云原生,阿里云即将重磅亮相 KubeCon China

    演讲人阿里云容器平台技术专家 熊欢(宁拙)议题简介在云时代,企业中基于容器的应用激增,由于人工操作、硬件故障等,发生容器故障的可能性大幅增加。因此,如何在不增加资源投入的情况下保证大规模容器的可靠性...

    文章 jessie筱姜 2019-06-12 2299浏览量

  • 规模化落地云原生,阿里云即将重磅亮相 KubeCon China

    议题简介在云时代,企业中基于容器的应用激增,由于人工操作、硬件故障等,发生容器故障的可能性大幅增加。因此,如何在不增加资源投入的情况下保证大规模容器的可靠性成为云平台面临的一个巨大挑战。阿里巴巴运行着...

    文章 k8s小能手 2019-06-12 11347浏览量

  • 【合集】规模化落地云原生,阿里云亮相 KubeCon China...

    在云时代,企业中基于容器的应用激增,由于人工操作、硬件故障等,发生容器故障的可能性大幅增加。因此,如何在不增加资源投入的情况下保证大规模容器的可靠性成为云平台面临的一个巨大挑战。阿里巴巴运行着数百万个...

    文章 jessie筱姜 2019-06-24 9814浏览量

  • 阿里云双11访谈之云数据库

    当出现主库的磁盘坏了,网络不通了等异常情况时,有一套智能的算法来决定主备库是否需要做切换,这都是默认在备库自动帮客户识别出来的。现在MySQL5.6、SQL Server2008,Redis、PPAS这些都提供了双机容灾服务。而且...

    文章 场景研读 2017-11-01 6773浏览量

  • 喧哗的背后:Serverless 的概念及挑战

    任何一台服务器都可能出现故障,如果自动识别故障,摘除有问题的实例,这是 Serverless 平台必须具备的能力;此外,操作系统的安全补丁升级,需要做到不影响业务,自动完成;日志和监控系统需要默认打通;系统的安全...

    文章 云栖TechDay-闫瑾 2020-06-16 119浏览量

  • 如何通过事务消息保障抢购业务的分布式一致性?

    一旦协调者发生故障&xff0c;参与者会一直阻塞下去&xff0c;整个系统将无法工作&xff0c;因此需要投入巨大的精力来保障事务协调者的高可用性。数据不一致问题。在阶段二中&xff0c;如果协调者向参与者发送commit请求之后&xff...

    文章 中间件小哥 2021-02-24 2483浏览量

  • 喧哗的背后:Serverless 的概念及挑战

    任何一台服务器都可能出现故障,如果自动识别故障,摘除有问题的实例,这是 Serverless 平台必须具备的能力;此外,操作系统的安全补丁升级,需要做到不影响业务,自动完成;日志和监控系统需要默认打通;系统的安全...

    文章 阿里巴巴云原生小助手 2020-05-06 917浏览量

  • 承担集团数万应用、研发人员日常工作,阿里持续交付...

    beta 测试会产生资损故障怎么处理,真实流量进入后,如果有 bug,肯定会导致一些问题,虽然影响小,但是也会导致一些不可弥补的问题。测试数据难以维护,经常被污染怎么办,这是一个复杂而头疼的问题。为了解决以上...

    文章 云效平台 2017-12-08 3069浏览量

  • 企业级数据库新型研发模式——数据管理DMS实践

    此外,可能还会有其他的问题,比如业务同学说表的主键是int类型,而因为数据量急速增长,马上就要超出int类型所能表示的范围了,再跑就查不到数据了,业务就会出现故障,此时该怎么办?对于这样数据量又大,流量又...

    文章 公开课小能手 2019-08-15 2176浏览量

  • 高德服务单元化方案和架构实践

    账号系统服务器的Tengine上安装UntiRouter,它请求的负责单元识别和路由,用户单元划分是通过记录用户单元关系的路由表来控制。PS:因历史原因缓存使用了tair和自建的uredis(在redis基础上添加了基于log的数据同步...

    文章 高德技术小哥 2019-11-25 7746浏览量

  • 关于 NIPS 2016 你应该知道的 50 件事情

    13.当用户机器学习系统交互时,不仅是系统在学习——用户的系统模型也会发生改变,但这点常常被忽视。我们应该如何对这个共同学习的过程建模?14.在构建机器学习系统时,让人参与到循环中通常是有用的,例如,使...

    文章 知与谁同 2017-08-01 1042浏览量

  • 运维前线:一线运维专家的运维方法、技巧实践1.4 ...

    第二,发生故障的时候,需要让研发参与处理。另外这也是系统的边界没划分清楚的问题,是让运维组件去承担业务上应该具备的容灾容错功能,这会令后面的运维系统建设增加很多不必要的功能。1.4.4 面向服务的自动化...

    文章 华章计算机 2017-05-02 2384浏览量

  • 《架构真经:互联网技术架构的设计原则(原书第2版)...

    本节书摘来自华章出版社《架构真经:互联网技术架构的设计原则(原书第2版)》一书中的第2章,第2节,作者 Scalability Rules:Principles for ...在推荐产品的情况下,如果我们想要合并用户和产品信息,应该怎么办...

    文章 华章计算机 2017-05-02 1359浏览量

  • 带你读《物联网之魂:物联网协议物联网操作系统》之...

    该层控制数据链路层物理层之间的信息转发,建立、维持终止网络的连接。具体说就是,数据链路层的数据在这一层被转换为数据包,然后通过路径选择、分段组合、顺序、进/出路由等控制,将信息从一个网络设备上传送...

    文章 温柔的养猫人 2019-11-12 820浏览量

  • Linux下用mdadm实现软件RAID

    有了RAID做保障,电脑里的数据看起来似乎已经很安全了,然而现有的情况还是不能让我们高枕无忧,想一想,万一磁盘出现故障怎么办?下面我们模拟一个更换RAID5故障磁盘的完整过程,希望以此丰富大家处理RAID5故障的...

    文章 shy丶gril 2016-05-25 1329浏览量

  • 章文嵩博士和他背后的负载均衡帝国

    客户端目标系统之间一般存在会话的概念(不止是web系统的http session),其本质在于server端会或多或少的存一些客户端整个会话期间交互的身份识别以及数据信息,为了防止server端每次都对同一个客户端问一下,你是...

    文章 kevinliali 2016-05-30 9405浏览量

  • 揭秘!双11万亿流量下的分布式缓存系统 Tair

    Tair的每一个业务集群水位其实是不一样的,双11前的每一次全链路压测,由于业务模型的变化,所用Tair资源会发生变化,造成水位出现变化。在此情况下,我们每次都需要压测多个集群间调度的Tair资源。如果水位低,就会...

    文章 技术小能手 2018-02-28 9043浏览量

  • 章文嵩(正明)博士和他背后的负载均衡(LOAD ...

    客户端目标系统之间一般存在会话的概念(不止是web系统的http session),其本质在于server端会或多或少的存一些客户端整个会话期间交互的身份识别以及数据信息,为了防止server端每次都对同一个客户端问一下,你是...

    文章 坤宇 2016-05-26 16268浏览量

  • 20 万网络节点背后的数据创新应用

    对于这一块,我们不仅仅是用,还做了相关的优化,一是压测之后的druid调优,二是容灾优化,三是控制成本。我们做LOG的时候是采用相关的开源组件来存储业务上报日志,当业务渐渐上线的时候,发现开源的方案扛不住。...

    文章 技术小能手 2018-08-02 1053浏览量

  • Java微服务开发指南-Java环境下的微服务

    但是问题总会出现,所以我们需要让应用能够优雅的处理失败而不是防止它发生,我们应该能够优雅的处理失败,而不是看着它不断向上抛出,最终导致整个系统崩溃。构建一个分布式系统远比构建一个共享内存、单进程的单体...

    文章 weipeng2k 2017-10-17 7990浏览量

  • 带你读《基于CUDA的GPU并行程序开发指南》之一:CPU...

    现在,让我们看看如果Fred的拖拉机发生故障后会发生什么。过去他们每分钟都能收获两颗椰子,但现在他们只有一台拖拉机和一把椰子锤。他们把拖拉机开到椰子树附近,并停在那儿。他们必须依次地执行线程1(Th1)和线程...

    文章 温柔的养猫人 2019-11-16 1275浏览量

1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化