• 视频监控日常使用存在哪些故障

    出色的环境适应能力:算法模块对于场景内由于车流、人流、季节、气候产生的光线、阴影变化不敏感,因此,可以适用于多种不同的室外环境;强化学习能力:现有的视频质量诊断系统与人类的故障识别能力仍有明显的差距,...
    文章 2017-07-05 854浏览量
  • 视频监控日常使用存在哪些故障

    出色的环境适应能力:算法模块对于场景内由于车流、人流、季节、气候产生的光线、阴影变化不敏感,因此,可以适用于多种不同的室外环境;强化学习能力:现有的视频质量诊断系统与人类的故障识别能力仍有明显的差距,...
    文章 2017-07-05 827浏览量
  • 系统的可靠性分析与设计

    即从软件系统不希望发生的事件(顶事件),特别是对人员和设备的安全及可靠性产生重大影响的事件开始,向下逐步追查导致顶事件发生的原因,直至基本事件(底事件),从而确定软件故障原因的各种可能组合方式和(或)...
    文章 2012-10-14 969浏览量
  • 阿里巴巴DevOps实践指南(二十一)|全景监控

    再通过统一 CMDB 解决监控元数据相互不统一的问题,通过智能算法平台,报警中心和故障平台集中管理事件,故障以及提升准确率。业务监控阿里巴巴“业务监控”采用专为监控自研的日志采集&计算框架,通过页面配置...
    文章 2021-07-06 239浏览量
  • 阿里双11网络技术揭秘:百万级物理和虚拟网络设备的...

    对可疑故障链路进行标红处理,通过庖丁可视化界面,轻松判断故障的发生原因。在故障发现、探测的最终结果可以对具体的用户呈现,也可以通过API形式对业务系统进行主动的信息推送。这意味着上层业务网络查询更加开放...
    文章 2018-01-05 4849浏览量
  • 闲鱼神探——线上问题定位与快速解决

    【*二阶平滑算法*】神探2.0将继续优化数据清洗方案,保证故障定位准确率的同时,不让数据成为系统发展瓶颈,优化自动化阈值算法。均值算法对于短期预测表现较好,但对长期效果表现不友好,我们不仅要考虑历史均值,...
    文章 2020-07-28 1455浏览量
  • 搜狗智能联想输入法,背后的运维又是如何智能的?

    大致的算法是每一个探针的请求都带一个ID,这个ID在各个模块都是打通的。运维工程师分析这个请求的ID在每个模块里面的具体表现,根据这些规则模板看它是否命中设定规则模板,然后定位系统,再根据这些规则模板的命中...
    文章 2017-11-27 1202浏览量
  • 基础设施助力双11(十):百万级物理和虚拟网络设备的...

    对可疑故障链路进行标红处理,通过庖丁可视化界面,轻松判断故障的发生原因。在故障发现、探测的最终结果可以对具体的用户呈现,也可以通过API形式对业务系统进行主动的信息推送。这意味着上层业务网络查询更加开放...
    文章 2019-07-31 933浏览量
  • CPU静默数据错误:存储系统数据不丢不错的设计思考

    本文重点讨论数据的不丢不错故障原因,以及数据存储系统如何防控设计,不对数据库事务深入讨论。1 常见的磁盘、内存、网络数据翻转(Bit Flip)对于计算机系统来说,不管是计算还是存储,不管是电子部件还是机械部件...
    文章 2021-07-01 3042浏览量
  • Raft共识插件详解【Hyperledger Fabric】

    Raft是一个分布式崩溃故障容错共识算法,它可以保证在系统中部分节点出现非拜占庭故障的情况下,系统依然可以处理客户端的请求。从技术上来讲,Raft是一个管理复制日志(Replicated Log)的共识算法,复制日志是复制...
    文章 2019-12-05 2156浏览量
  • 轻松应对双11,百万级物理和虚拟网络设备的网络智能化...

    对可疑故障链路进行标红处理,通过庖丁可视化界面,轻松判断故障的发生原因。在故障发现、探测的最终结果可以对具体的用户呈现,也可以通过API形式对业务系统进行主动的信息推送。这意味着上层业务网络查询更加开放...
    文章 2017-12-14 1853浏览量
  • 撮合系统设计

    如图2.1所示,撮合引擎的核心业务模块就是撮合交易算法撮合交易算法的任务一方面是完成对客户所下订单进行公平合理的排列和撮合功能,也要保证撮合算法的公平性、高效性以及扩展性等。由于不同金融交易系统的撮合业务...
    文章 2016-09-16 23265浏览量
  • 阿里巴巴DevOps实践指南(二十)|业务系统安全工程

    故障恢复后,安全生产委员会还需要组织相关人员排查和分析故障原因,制定整改方案,确定故障责任人,推进和落实整改方案,防止相同故障的再次发生。业务系统安全工程从以上的实践过程可以看出,企业很难依靠单一手段...
    文章 2021-07-06 212浏览量
  • 裴丹教授采访|如何实现智能运维及对运维行业的未来...

    故障识别也叫故障根因分析(Root Cause Analysis),是智能运维领域非常有挑战性的一个工作,主要在于三个原因: 对各类事件的监控要全面,少了数据不行,实践中很难一下就全面监控各类事件;对各类事件的监控要准确...
    文章 2017-08-01 1928浏览量
  • 系统设计之——架构师职责和设计原则

    如果引发这些错误的原因比较低级,团队成员将无法从解决错误的过程中收获成就感,团队士气下降,甚至形成恶性循环。4)提前预知团队成员的问题并给予指导。划分模块以及安排工作时需要考虑团队成员的能力,给每个成员...
    文章 2018-11-18 2554浏览量
  • 山哥的撮合系统火力加强升级版

    撮合引擎核心业务模块就是撮合交易算法撮合交易算法的任务一方面是完成对客户所下订单进行公平合理的排列和撮合功能,也要保证撮合算法的公平性、高效性以及扩展性等。由于不同金融交易系统的撮合业务各有不同,因此本...
    文章 2018-10-31 1847浏览量
  • 阿里:千亿交易背后的0故障发布

    我们针对阿里的故障产生原因做了统计,其中很大一部分都是线上变更引起的,相信在座各位也会遇到或者制造过故障,开发和运维的同学对故障都是很敬畏的。故障大家都遇到过,但是故障的影响差异会比较大。有些故障可能...
    文章 2018-04-20 5069浏览量
  • 无人值守时代,运维如何保障发布质量?

    我们针对阿里的故障产生原因做了统计,其中很大一部分都是线上变更引起的,相信在座各位也会遇到或者制造过故障,开发和运维的同学对故障都是很敬畏的。故障大家都遇到过,但是故障的影响差异会比较大。有些故障可能...
    文章 2018-04-18 3740浏览量
  • 大数据应用的测试发展之路(三)

    但我们同时判断,完全的高度智能测试与无人驾驶一样,目前还不成熟,主要原因不在于算法与模型,而是测试数据的不足。结束语 阿里巴巴的搜索推荐与广告系统的质量建设之路,经过近 10 年的不断发展,在许多测试同学...
    文章 2020-04-29 779浏览量
  • 干货|一文读懂阿里云数据库Auto Scaling是如何工作的

    基于性能数据的数据库规格ScaleUp实时推荐方法示意图2.3.2 ScaleOut决策算法ScaleOut决策算法与ScaleUp决策算法的思路类似&xff0c;本质问题是确定增加多少个只读节点&xff0c;能使实例当前的workload负载降至合理的水位...
    文章 2021-07-08 3664浏览量
  • 阿里搜索事业部故障快速恢复实践

    同时也不能因为整条链路上任意模块故障,就能要求导购或者交易整体切流。所以,业务自身多机房部署和切流能力就是必须的。如果不是最入口的切流,那上游过来的流量就会产生跨机房访问。跨机房的延迟就必须考虑在内...
    文章 2018-03-16 2663浏览量
  • 走近伏羲,谈5000节点集群调度与性能优化

    故障恢复对外部模块依赖:伏羲Master具有对用户透明的故障恢复功能(Failover),其恢复过程依赖写在Nuwa上的Checkpoint(注:Nuwa是飞天平台的协同系统,如名字服务)。因此,整体恢复速度会受到Nuwa访问速度的影响...
    文章 2016-12-18 4333浏览量
  • 封神-运维大脑|日志检测工具

    4.总结本期给大家介绍了封神系统运维大脑模块的相关知识,分享了机器学习中两个常用的文本分析算法。目前运维大脑所能达到的效果是可以把日志中报错进行识别并展示,但是我们的最终目标是可以识别出故障,虽然普通的...
    文章 2021-03-30 3199浏览量
  • 中国移动苏州研发中心消息队列高可用设计之谈|...

    Raft 是一种分布式系统中易于理解的共识算法,该协议本质上是 Paxos 算法的精简版,而不同的是依靠 Raft 模块化的拆分以及更加简化的设计,其实现起来更加容易和方便。[1]模块化的拆分主要体现在 Raft 把一致性协议...
    文章 2019-08-14 6253浏览量
  • 对设计模式的理解(六大原则)

    定义:不要存在多于一个导致类变更的原因。通俗的说,即一个类只负责一项职责。问题由来:类T负责两个不同的职责:职责P1,职责P2。当由于职责P1需求发生改变而需要修改类T时,有可能会导致原本运行正常的职责P2功能...
    文章 2016-05-05 1209浏览量
  • 阿里巴巴DevOps实践指南(二十四)|智能运维

    通过算法,机器学习方法对应用发布过程进行异常检测,从而避免由于代码变更导致的故障。基于大量监控数据、日志数据的积累,并有算法的加持,我们推出了无人值守发布系统。无人值守发布 riskfree 系统上线以来,从...
    文章 2021-07-06 345浏览量
  • 带你读《智能制造之卓越设备管理与运维实践》之三:运...

    2.预测性维修预测性维修是以设备当前的实际工作状况为依据,相比传统的以设备使用时间为依据的维修,它通过先进的状态监测与诊断手段,识别故障的早期征兆,对故障部位、故障程度和发展趋势做出判断,根据诊断结果来...
    文章 2019-11-08 1195浏览量
  • MySQL数据库的几种常见高可用方案

    但是由于网络波动等一些客观原因,导致半同步复制发生超时而切换为异步复制,那么这时便不能保证数据的一致性。所以尽可能的保证半同步复制,便可提高数据的一致性。该方案同样使用双节点架构,但是在原有半同复制的...
    文章 2017-04-25 12736浏览量
  • 深度|大数据算法应用的测试发展之路

    在这个方向上,我们在用例生成方面通过用例膨胀和推荐技术、基于遗传算法动态生成有效测试用例、在用例执行阶段使用动态编排的回归技术,通过这些技术极大地提升了在线模块的功能测试的覆盖率。此外,我们比较多地...
    文章 2020-04-30 7781浏览量
  • 《Spark大数据分析:核心概念、技术及实践》一 第3章 ...

    迭代算法是指那些在同样数据上迭代多次的数据处理算法。使用这类算法的应用包括机器学习和图处理应用。这些应用都在同样的数据上迭代数十次乃至数百次算法。对于这类应用,Spark是理想的选择。Spark内存计算的特性...
    文章 2017-05-02 964浏览量
1 2 3 4 ... 14 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化