• 运维数据生态:高阶落地的一些场景

    本章节中的高阶场景以告警自动阈值、知识图谱、故障自动评估、无人值守变更和数据血缘流向为例&xff0c;分别阐述相应的场景落地和具体方法。1、知识图谱知识图谱的大面积运用是从谷歌的搜索服务开始的&xff0c;从此知识...
    文章 2021-11-04 82浏览量
  • 企业为什么要做应用多活?

    我们需要建设更高阶的容灾架构技术&xff0c;还需要增强“基础设施”、“业务系统”、“保障工具”、“生产制度”、“应急人员”的协同。通过架构与组织的协同&xff0c;实现容灾多活的能力保鲜。这种能力&xff0c;不是即刻...
    文章 2022-02-09 222浏览量
  • 2PC AND 3PC

    在两阶段提交协议中,系统一般包含两类机器(或节点):一类为协调者(coordinator),通常一个系统中只有一个;另一类为事务参与者(participants,cohorts或workers),一般包含多个,在数据存储系统中可以理解为...
    文章 2017-09-24 1396浏览量
  • 分布式系统中只有两个难题(下)

    并没有什么东西去阻止进程恢复、追上系统状态以及参与下一次的算法执行。失败的进程无法再继续参与当前这一轮的协作。为恢复的进程分配一个新的、不同的ID不会使模型等价于崩溃–恢复模型&xff08;之后讨论&xff09;...
    文章 2022-01-24 90浏览量
  • 面向失败的设计-自动化运维管控

    因此,我们一般会从两个视角来定义应用系统关键指标:业务视角和系统视角,这两个视角密不可分(如接口调用量和业务单量)。我们将指标分为面向最终结果的指标和面向过程的指标,这些指标同样也需要精确无歧义的定义...
    文章 2019-11-08 902浏览量
  • 如何检测 Web 服务请求丢失问题

    对于 Zipkin,一般情况下请使用 v2 版接入点,v1 版接入点仅限对 Zipkin 十分了解的高阶用户使用。本文作者:徐建伟,花名竹影,阿里云技术专家,多年系统架构,性能调优经验,目前主要从事链路跟踪,应用监控相关...
    文章 2019-09-16 2181浏览量
  • 关于raid的介绍

    因此,独立存取模式可以尽量地利用overlapping 多任务、Tagged Command Queuing等等高阶功能,来"隐藏"上述磁盘驱动器的机械时间延迟﹝Seek 和Rotational Latency﹞。由于独立存取模式可以做overlapping 多任务,...
    文章 2017-11-22 1077浏览量
  • [高级]关于分布式事务、两阶段提交协议、三提交协议

    在分布式系统中,为了保证数据的可用,通常,我们将数据保留多个副本(replica),这些副本放置在不同的物理的机器上。为了对用户提供正确的增\删\改\差等语义,我们需要保证这些放置在不同物理机器上的副本是...
    文章 2018-10-10 1285浏览量
  • 通俗易懂!Kafka 开发快速入门看这篇就够了1

    还有用来做数据集成的 Kafka Connect API 和流式处理的 Kafka Streams 等高阶客户端&xff0c;但这些高阶客户端底层仍然是生产者和消费者API&xff0c;只不过是在上层做了封装。Producer&xff1a;消息生产者&xff0c;就是向 ...
    文章 2022-06-14 101浏览量
  • 黑客与宕机

    内存转储分析属于高阶的软件调试能力,需要工程师有丰富且全面的系统级别理论知识和大量的疑案破解似的上手实践经验。内存转储分析的方法论 内存转储分析是对专业能力要求极高的一个工作,也是非常不容易的一件事情...
    文章 2020-07-17 1111浏览量
  • 【转】奇文共欣赏,疑义相与析:原文转载《电脑维护...

    可别小看了这些被隐藏的信息,当系统出现莫名其妙的故障时,没准就能从它们中间找出突破口。1.查杀自动消失的双进程木马前段时间朋友的电脑中了某木马,通过任务管理器查出该木马进程为“system.exe”,终止它后再...
    文章 2010-08-13 1208浏览量
  • 跟我学分布式事务之2PC和3PC

    在分布式系统中,为了保证数据的可用,通常,我们将数据保留多个副本(replica),这些副本放置在不同的物理的机器上。为了对用户提供正确的增\删\改\差等语义,我们需要保证这些放置在不同物理机器上的副本是...
    文章 2015-12-07 1014浏览量
  • 带你读《Prometheus监控实战》之一:监控简介

    如果监控的基础设施是手动维护的,或者过于复杂,那么由此产生的问题将导致监控系统落后或者发生故障,然后你花费更多的时间来修复和维护监控系统,而不是监控这件事本身。应尽可能使监控系统的实施和部署自动化:...
    文章 2019-11-11 4128浏览量
  • iSCSI存储系统知识

    PC+NIC系统架构 PC+iSCSI target软件方式是一种低价低效比的iSCSI存储系统架构解决方案,另外还有一种基于PC+NIC的高阶高效性iSCSI存储系统架构方案。这款iSCSI存储系统架构方案是指在PC服务器中安装高性能的TOE...
    文章 2016-11-02 1758浏览量
  • 分布式事务、XA、两阶段提交、一阶段提交

    事务执行时间的延长意味着锁资源发生冲突的概率增加,当事务的并发量达到一定数量的时候,就会出现大量事务积压甚至出现死锁,系统性能就会严重下滑。这就是使用XA事务4.一阶段提交(Best Efforts 1PC模式) 不像两...
    文章 2017-07-03 7203浏览量
  • 开源来势汹汹,Ceph 靠什么颠覆传统企业级存储?

    而最高阶的IF700,用的则是SanDisk ION Accelerator,这套软件源自Fusion-io时期,去年曾推出整合式设备ION Accelerator Appliance,而现在整合到InfiniFlash系列的架构下,主攻高效能需求的块存储应用。由此可知,...
    文章 2017-06-04 2027浏览量
  • 流式计算领域新霸主Flink的那些事儿

    在大数据处理领域,批处理与流处理一般被认为是两种截然不同的任务,一个大数据框架一般会被设计为只能处理其中一种任务。比如,Storm只支持流处理任务,而MapReduce、Spark只支持批处理任务。Spark Streaming是...
    文章 2019-10-25 3110浏览量
  • 视频监控落地四要素:预测、检测、报警及定位

    从技术架构、业务流程的角度,我们的监测指标是否正常,从外部因素分析,一般会受到它的上游影响。按照这个思路,逐一分析上游是否正常,就形成了一条链路。这种例子很多,比如系统架构的模块A,B,C,D,E的QPS。...
    文章 2017-07-05 1678浏览量
  • 国内Java面试总是问StringBuffer,...档次为什么这么低?

    比如前几年支付宝光缆被挖断的事件,在网络出现故障的时候,支付宝就在可用性和数据一致性之间选择了数据一致性,用户感受到的是支付宝系统长时间宕机,但是其实背后是无数的工程师在恢复数据,保证数数据的一致性。...
    文章 2019-08-13 3351浏览量
  • 开源自建/托管与商业化自研 Trace,如何选择?

    负责稳定性的同学应该对这种场景不陌生:系统在夜间或整点大促时会出现偶发性的接口超时,等到发现问题再去排查时,已经丢失了异常现场,并且难以复现,无法通过手动 jstack 来诊断。而目前开源的链路追踪实现一般...
    文章 2021-08-24 310浏览量
  • 趣头条基于 Flink+ClickHouse 构建实时数据分析平台

    趣头条主要使用了 Flink 高阶版本的一个特性——StreamingFileSink。StreamingFileSink 主要有几点功能。第一,forBulkFormat 支持 avro、parquet 格式,即列式存储格式。第二,withBucketAssigner 自定义按数据时间...
    文章 2020-04-02 4459浏览量
  • “进击的数据库”——传统数据库上云三部曲

    首先选择一个原数据库和一个目标数据库,然后选择需要迁移的database,如果在迁移前的初始校验过程中出现任何问题,DTS服务系统会提示用户迁移失败并显示出相应的失败原因。当用户的数据库迁移到阿里云之后,用户最...
    文章 2018-05-09 6294浏览量
  • 互联网泛娱乐直播安全的解决之道

    DRM是另一种更高阶的防盗链技术,这种技术主要是对视频帧逐帧加密,在播放端再解密。DRM的防盗链效果更好,但需要有比较强的视频处理的技术能力。另一类资损,是对不在播的内容做了错误的资源位推荐,影响用户体验,...
    文章 2021-04-01 615浏览量
  • 如何带领团队“攻城略地”?优秀的架构师这样做

    梳理明确高阶需求和非功能性需求;客户有什么资产,星环(阿里电商操作系统)/阿里云等有什么解决方案;沟通,方案建议,多次迭代,交付总体架构;架构决策。职责 1.从客户视图来看: 坚定客户高层信心:利用架构和...
    文章 2019-07-03 16732浏览量
  • 独家|一文读懂优化算法

    但是贝叶斯学派已经证明,开始时不管使用什么样的先验概率分布,随着实验次数的增多,后验概率分布对初始先验概率分布的依赖越来越小,后验概率分布最终趋于一致。贝叶斯(Bayes)预测是一种以贝叶斯统计方法为...
    文章 2017-10-10 2450浏览量
  • 运维数据生态之数据思维

    一般会有一些特殊场景是流程无法覆盖的&xff0c;如重大活动的资源扩容和紧急情况下的系统降级。在链路系统扩容方面存在A系统扩容和B系统扩容&xff0c;如果有数据支撑能直接证明A系统扩容比B系统扩容方式好&xff0c;那就...
    文章 2021-11-04 47浏览量
  • 《云数据库RDS MySQL从入门到高阶》读后感下

    结果导致系统混乱&xff0c;数据损坏。写一个while循环&xff0c;每轮ping网关&xff0c;累计连续失败的次数&xff0c;当连续失败达到一定次数则运行service keepalived stop关闭keepalived服务。如果发现又能够ping通网关&xff...
    文章 2022-09-07 66浏览量
  • Hadoop实战-part2 Hadoop 2.0

    10.深入理解Scala——高阶的,有兴趣了再看11.机器学击败AlphaGo的武林秘籍——理论,除了神经网络12.深度学习 人工智能算法——理论,神经网络13.机器学习实战(哈林顿,基于Python)——实践看视频的方法:看完...
    文章 2021-09-01 92浏览量
  • 对话 IJCAI 07「卓越研究奖」得主 Alan Bundy:理解...

    同时,我更希望,AI 领域在下个 50 年依旧会出现如此多出色的研究成果,祝福 IJCAI 的 100 周年!最后,AI 科技评论也代表广大研究者向 Alan Bundy 这位在 AI 领域成绩斐然的科学家取了一回经。Alan Bundy 本人也向...
    文章 2019-05-18 664浏览量
  • IBM测试流程

    每一阶段的结束被看做是输出,都是作为下一阶段的输入,在测试流程上有明确的定义什么这些输入和输出的标准,后面的章节对这些标准做详细的阐述。每一阶段的测试,都应该包含前一阶段的测试内容,也就是前一 段...
    文章 2017-07-03 2550浏览量
1 2 3 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化