• 关于

    自动相关性反馈故障原因

    的搜索结果
  • 还不知道AIOps嘛?阿里这么火的智能运维,你不能不知道!

    摘要:业务通过产品技术发挥价值的一个必要条件就是可以在线上稳定持续的运行,这一直是运维人员的终极目标。相信大家在使用天猫、淘宝、支付宝时几乎没有遇到过无法使用的情况,阿里是如何做到的呢?AIOps又是什么?本文主要关注线上业务的研发和运维流程,由阿里云高级技术专家向大家介绍如何将机器学习算法引入运...

    文章 聒小小噪 2018-05-30 11053浏览量

  • 阿里:千亿交易背后的0故障发布

    前言 近几年,我们在发布效率和稳定性方面做了不少工作,其中效率简单的说就是发布耗时,一个是发布的速度,比如一个应用是1个小时发布完成,还是5分钟发布完成?另一个是人员介入,开发在发布过程中是否需要介入处理各种发布过程中出现的问题?这两者都做好了,才能说是发布效率提升了。稳定性最基础的是系统的稳定性...

    文章 阿里云头条 2018-04-20 5012浏览量

  • 无人值守时代,运维如何保障发布质量?

    导读:阿里巴巴千亿交易背后,如何尽量避免发布故障?在面对实际运维过程中遇到的问题该如何解决?近日,在GOPS大会上,阿里巴巴运维技术专家少荃,给我们带来了解决方案和思路。 作者:陆叶平(花名少荃),阿里巴巴研发效能事业部技术专家。目前从事运维中台(阿里内部叫诺曼底)建设方面的工作,是集...

    文章 云效平台 2018-04-18 3394浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!

    广告

  • 双11 背后的全链路可观测性:阿里巴巴鹰眼在“云原生时代”的全面升级

    本文节选自《不一样的 双11 技术:阿里巴巴经济体云原生实践》一书 作者:周小帆(承嗣)  阿里云中间件技术部高级技术专家王华锋(水彧)  阿里云中间件技术部技术专家徐彤(绍宽)  阿里云中间件技术部技术专家夏明(涯海)  阿里云中间件技术部技术专家 导读:作为一支深耕多年链路追踪技术 (Trac...

    文章 阿里巴巴云原生小助手 2019-12-20 474浏览量

  • 阿里集团搜索和推荐关于效率&稳定性的思考和实践

    背景 效率和稳定性是我们从工程层面来衡量系统对业务支持能力的两个关键指标。从流程管控上来看,业务效率的提升一定程度上会影响到稳定性,而对稳定性要求过高又会带来对业务效率的影响。从业务的角度来看,成熟的业务会更偏向于稳定性,而新业务更偏向于效率。效率和稳定性兼顾,也就变成了一个巨大的挑战。 我们理解...

    文章 李伟-剑豪 2018-02-11 5031浏览量

  • 全网唯一完整译文 | Waymo无人车报告:通往自动驾驶之路

    前不久,Waymo(前Google自动驾驶项目)向美国交通部提交了一份43页的安全报告,这份报告详细说明了Waymo如何装备和训练自动驾驶车辆,从而避免驾驶中的一般和意外情况发生。这份报告是Waymo以第一视角,对自己自动驾驶技术的最完整解读。 据雷锋网了解,Waymo可能最快今年11月上线自动驾...

    文章 行者武松 2017-11-06 1898浏览量

  • 3+1保障:高可用系统稳定性是如何炼成的?

    作者 | 承霄来源 | 阿里技术公众号一 概述自己以及带领的团队曾经负责较多不同类型的互联网服务系统,如几十万应用数&亿级流量的云计算平台、年营收将近千亿的广告系统、亿级用户千万级日活的钉钉工作台系统、亿级交易额的钉钉市场&交易系统、算法在线离线工程系统等相关系统或子系统,整体而...

    文章 开发者小助手_LS 2021-01-27 7978浏览量

  • 如何做好一名稳定性SRE--业务团队系统稳定性的思与行

    前言 2013年,当我第一次接触稳定性的时候,我是有些懵的,当时完全不知道稳定性是什么,也不清楚要做什么。在接下来的8年里,我先后在菜鸟、天猫、盒马从事中间件、业务系统、架构等方面的工作,期间一直穿插着负责稳定性和大促的保障工作。我的心态,大致经历过以下几个阶段: low:完全不懂,觉得稳定性就...

    文章 茶什i 2020-10-26 2360浏览量

  • 阿里巴巴统一运维智能化平台演进之路

    我今天分享的主题是《阿里巴巴实时计算平台运维架构演进》。一共分四个部分: 实时计算平台的运维挑战 统一的运维自动化平台 主动出击,消除隐患 走向智能化 实时计算平台的运维挑战 大家知道最近两年随着AlphaGo的兴起,算法成为各个公司,如阿里巴巴、腾讯重金投入的场景。实时计算平台包括实时计算、流...

    文章 技术小能手 2018-07-20 2404浏览量

  • 《Internet 路由结构(第2版•修订版)》一第7章 冗余、对称和负载均衡7.1 冗余

    本节书摘来自异步社区《Internet 路由结构(第2版•修订版)》一书中的第7章,第7.1节,作者【美】Sam Halabi,更多章节内容可以访问云栖社区“异步社区”公众号查看 第7章 冗余、对称和负载均衡 Internet 路由结构(第2版•修订版)本章包括如下主题。 冗余——链路故障发生时...

    文章 异步社区 2017-05-02 1368浏览量

  • 阿里移动|《蚂蚁金服移动端高可用技术实践》

    摘要:对于移动技术而言,2017年是继往开来之年。一方面是移动技术领域进入深水区,另一方面移动技术边界和内涵被不断重塑。阿里巴巴希望进一步推动移动应用研发事实标准落地,从而赋能整个行业开发者。在2017年杭州云栖大会上,蚂蚁金服高级技术专家竹光为大家分享了蚂蚁金服移动端在高可用技术方面的具体实践。...

    文章 场景研读 2017-12-07 1667浏览量

  • OceanBase实践入门:高可用原理和容灾方案

    本文内容是直播的文字稿,直播视频回放地址https://tech.antfin.com/community/live/773 OceanBase的高可用可以做到自动故障切换和不丢一点数据,即使是异地多机房部署也是如此。这是OceanBase的特性之一。OceanBase的高可用机制是数据库内核能力...

    文章 mq4096 2019-08-05 2933浏览量

  • 构建可靠系统的原则与实践

    随着阿里技术的发展,我们的技术系统越来越成为社会的基础设施,对于这些系统的可靠性要求也就越来越高。但是实际上很多的基础的产品和系统确仍然会出现一些稳定性问题,那么如何才能构建可靠的系统呢?是不是制定非常严格而细致的规则就可以做出可靠的系统呢? 航空业的教训 在回答这个问题之前,我们先来看看对于系统...

    文章 行易 2019-04-24 12478浏览量

  • 面试题大全

     模拟电路 1、基尔霍夫定理的内容是什么? 基尔霍夫定律包括电流定律和电压定律 电流定律:在集总电路中,任何时刻,对任一节点,所有流出节点的支路电流的代数和恒等于零。 电压定律:在集总电路中,任何时刻,沿任一回路,所有支路电压的代数和恒等于零。 2、描述反馈电路的概念,列举他们的应用。 ...

    文章 cometwo123 2014-10-11 1195浏览量

  • ECS Windows 系统蓝屏 (BSOD) 以及停止响应 (Hang) 的处理

    用户在 Windows 系统上有时会遇到蓝屏 (BSOD, Blue Screen of Death),或者机器停止响应 (Hang)  这两类业务影响严重的问题。Windows 系统蓝屏后,默认配置下机器会自动重启恢复;对于机器停止响应,往往也需要重启作为临时解决方案以快速恢复业务,这都会造成业...

    文章 隽勇 2016-10-25 3427浏览量

  • ECS Windows 系统蓝屏 (BSOD) 以及停止响应 (Hang) 的处理

    用户在 Windows 系统上有时会遇到蓝屏 (BSOD, Blue Screen of Death),或者机器停止响应 (Hang)  这两类业务影响严重的问题。Windows 系统蓝屏后,默认配置下机器会自动重启恢复;对于机器停止响应,往往也需要重启作为临时解决方案以快速恢复业务,这都会造成业...

    文章 优惠码发放 2017-12-03 1329浏览量

  • 历年双11实战经历者:我们是如何做数据库性能优化及运维-CloudDBA和天象

    8月24日阿里云数据库技术峰会上,阿里云高级DBA专家玄惭带来面对超大规模的数据库集群,尤其是在每年像双11这样重大促销活动中,阿里云是如何进行运维和优化的。本文主要介绍了天象和CloudDBA两个产品,包括他们的起源、基于系统画像仓库的应用、产品化等,最后对RDS产品的可诊断性建设和可运维性建设...

    文章 场景研读 2017-09-07 9844浏览量

  • 通过支付宝服务中断事件看系统可靠性和YunOS的可靠性

    支付宝故障事件引发了大量的关注和讨论。事情基本过程是因为电信运营商光纤被挖断,导致支付宝服务故障,2小时左右后服务恢复正常。本人曾有幸做过一些关于系统可靠性方面的工作,想借此次事件抱着抛砖引玉的态度,班门弄斧地谈一下系统的可靠性和对YunOS可靠性的一些想法。   系统可靠性是个什么东东? A...

    文章 panzijing 2016-01-14 8152浏览量

  • 玩转ECS第3讲 | ECS自助服务之智能诊断和自动化修复

    演讲嘉宾简介:滕圣波(云普),阿里云高级技术专家,2018年5月加入阿里云,作为架构师搭建了ECS的事件体系,同时也是阿里云的官方自动化运维平台-运维编排服务的主架构师之一,目前负责ECS智能自治服务、云桌面等领域。在加入阿里云之前,是VMware中国研发中心终端用户计算部门的架构师,拥有北京邮电...

    文章 阿里云弹性计算 2020-10-28 1573浏览量

  • 业务异常只能瞅着数据库崩溃?别慌,数据库自治服务DAS的自动SQL限流功能来了!

    作者:云矶,阿里云数据库高级开发工程师 01、背景 随着技术的发展,尤其是云数据库的普及,数据库系统变得越来越稳定,运维工作也越来越轻松,版本升级、实例迁移等都可以自动完成,上层业务不会有太大的感知。即使硬件设备或者网络出现故障,巡检系统也可以快速迁移、及时重启,保证服务稳定。 但现有的这些手段几...

    文章 Roin123 2020-04-08 654浏览量

  • 如何搞好团建和提高团队执行力?

    最近一直听朋友都在探讨怎么样做好团队建设、怎样搞好团队执行力!这里就关于如何提高团队执行力以及团队建设几点措施言语一二, 主要从时间管理、需求管理、进度管理、责任机制、团队沟通、人才储备、项目质量等几方面稍作整理,希望各位猿们积极指导。 1、时间管理:充分保证工作8小时 出现情景: 员工普...

    文章 fuyifang 2015-06-25 852浏览量

  • 某金融公司实践 | 从SRE&DevOps&PE谈如何颠覆应用运维认知

    导读:[GO SRE!] 为数人云SRE系列活动专题,本文是北京站线下活动“当西方的SRE遇上东方的互联网”中某金融王超老师的分享。 他将从SRE,Devops, PE间的关系开始,介绍企业该如何构建适合自己的运维组织架构并管理团队,讲解持续交付、监控、容量规划等具体运维场景实操,从工程实践的角度...

    文章 行者武松 2017-08-01 1513浏览量

  • 物联网RFID在工业生产控制中的应用

    目前我国工业物联网有智能化生产、智能化产品、网络协同制造、个性化定制等四种模式,其核心要义是通过数据应用与智能连接,提升生产效率和质量,创造精准供给。工业物联网制造业生产线几乎每月都要损耗大量物料,并且生产结果与预期因为有误差而影响交货的情况时有发生,生产线也往往因人为原因造成种种误差。将RFID...

    文章 朗锐智科1 2017-11-30 1448浏览量

  • 如何构建整体的智慧城市建筑

    智慧城市利用物联网的力量来改善服务交付并优化城市基础设施。在这里,驾驶员无需搜索停车位,他们会收到自动通知;在需要收集废物时,废物容器将告诉卡车司机;没有交通阻塞,智能交通灯会根据实时交通分析等自动调整信号定时。 这些示例说明了舞台上发生的情况,但是幕后是什么?在本文中,我们将回答这个问题,揭示使...

    文章 物联网IoT996 2020-05-29 412浏览量

  • 企业IT架构转型之道:阿里巴巴中台战略思想与架构实战. 3.3 阿里巴巴分布式服务框架HSF

    3.3 阿里巴巴分布式服务框架HSF 阿里巴巴集团内部使用的分布式服务框架HSF(High Speed Framework,也有人戏称“好舒服”)已经被很多技术爱好者所熟知,目前已经支撑着近2000多个应用的运行,早期还有一个对应的开源项目Dubbo,因为某些原因,在2012年年底,阿里巴巴停止了...

    文章 华章计算机 2017-05-02 3600浏览量

  • 翻译-DevOps究竟是什么?

    原文地址:http://www.drdobbs.com/architecture-and-design/what-exactly-is-devops/240009147 作者:Neil Garnichaud 软件开发目前的最新趋势是DevOps文化,即开发人员和运营人员一起确保软件以最低的故障率...

    文章 无敌西瓜 2014-10-03 689浏览量

  • Dubbo 常见错误及解决方法

    导读 『StabilityGuide』是阿里多位阿里技术工程师共同发起的稳定性领域的知识库开源项目,涵盖性能压测、故障演练、JVM、应用容器、服务框架、流量调度、监控、诊断等多个技术领域,以更结构化的方式来打造稳定性领域的知识库,欢迎您的加入。 @GitHub :https://github.co...

    文章 中间件小哥 2019-10-12 3908浏览量

  • TICA 2019 如何保障智能硬件产品的快速迭代

    导读:随着无人机技术的不断发展,相关产品的软硬件和算法的经过了一系列的快速迭代,来自大疆的张晓明为我们分享大疆是如何做快速迭代与测试,在快速迭代之中,大疆的研发测试做了什么,遇到了什么样的困境和挑战,又是如何做到突破。 我们是做无人机的,我周围的朋友一提到无人机,基本上都会问我这个东西能够飞多远、...

    文章 KB小秘书 2020-03-03 347浏览量

  • Elasticsearch生态&技术峰会 | Elasticsearch在企查查的应用实践

    开源最大的特征就是开放性,云生态则让开源技术更具开放性与创造性,Elastic 与阿里云的合作正是开源与云生态共生共荣的典范。值此合作三周年之际,我们邀请业界资深人士相聚云端,共话云上Elasticsearch生态与技术的未来。本篇内容是企查查搜索部门经理范兆明分享的Elasticsearch在企...

    文章 工程师甲 2021-03-22 2243浏览量

  • 【智驾深谈】特斯拉死亡事故官方洗白,业界被判死缓(万字报告)

    2016年5月7日,一款特斯拉2015 Model S型轿车在经过佛罗里达州Williston西郊高速公路的时候,与一辆拖挂卡车相撞,驾驶员当场收到致命伤害。从该车提取的数据显示: 碰撞时刻特斯拉处于Autopilot状态; 自动紧急制动(AEB)系统并没有提供任何预警或在碰撞时刻起作用...

    文章 知与谁同 2017-08-01 1045浏览量

1 2 3 4 ... 8 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT