• 分布式系统:Lamport 逻辑时钟

    值得注意的是这里的因果关系指的是时序关系,即时间的前后,并不是逻辑上的原因和结果。那么是否我们可以参考狭义相对论来定义分布式系统中两个事件的时序呢?在分布式系统中,网络是不可靠的,所以我们去掉 可以 和...
    文章 2019-02-01 3317浏览量
  • 蚂蚁金服轻量级监控分析系统解析|SOFAChannel#6 直播...

    这里我提一下为什么我们选择适配普罗米修斯的 API,而不是其他时序数据库的 API:其中一个重要原因是它的查询能力明显比其他时序数据库的查询能力强大,也比较简洁,特别是在跨多个 Metrics 查询时。举一个例子,...
    文章 2019-07-31 590浏览量
  • 蚂蚁金服轻量级监控分析系统解析|SOFAChannel#6 直播...

    这里我提一下为什么我们选择适配普罗米修斯的 API,而不是其他时序数据库的 API:其中一个重要原因是它的查询能力明显比其他时序数据库的查询能力强大,也比较简洁,特别是在跨多个 Metrics 查询时。举一个例子,...
    文章 2019-06-28 1089浏览量
  • 回顾《网易数据基础平台建设》

    每个coordinator节点都能接收SQL,没有集中统一的SQL管理,如果挂掉所有历史信息都无法追踪。我们基于Impala问题做了相应整改: (1)首先是基于Zookeeper的Load Balance机制;(2)管理服务解决SQL无法持续化问题,...
    文章 2020-02-05 425浏览量
  • 回顾《网易数据基础平台建设》

    每个coordinator节点都能接收SQL,没有集中统一的SQL管理,如果挂掉所有历史信息都无法追踪。我们基于Impala问题做了相应整改: (1)首先是基于Zookeeper的Load Balance机制;(2)管理服务解决SQL无法持续化问题,...
    文章 2020-02-04 284浏览量
  • 高德地理位置兴趣点现势性增强演进之路

    现有的时序异常模型主要依赖于使用行为量的趋势特征做判断,存在挖掘资料覆盖上的天花板,以加油站、ATM、公共厕所等为例,这些类型的POI因自身属性的原因导致无挖掘资料,趋势模型无能为力。因而提出基于日志...
    文章 2021-01-08 478浏览量
  • 主要的编程范型

    这也是Peter使用“cells”这个专用名词的原因:在本的讨论中,需要从“变量/常量”这样的概念中,剥离“未命名或命名的、确定的或非确定的,以及串行的或并发的”这三方面的性质。当不考虑一个存储位置上的命名...
    文章 2018-12-18 933浏览量
  • 如何正确使用缓存?

    时序图所示,线程A先失效缓存数据的时候,B线程读请求发现缓存数据为空的话,就会从数据库中读取旧值放入到缓存中,这样就导致后续的读请求读到的都是缓存中的脏数据。针对这样的情况可以采用延时双删的策略来有效...
    文章 2019-11-25 1870浏览量
  • HBase实战|58HBase平台实践和应用-平台建设篇

    在一次排查HBase问题的时候发现RS进程存在大量的CLOSE_WAIT,最多的达到了6000+,这个问题虽然还没有直接导致RS挂掉,但是也确实是个不小的隐患。从socket的角度分析产生CLOSE_WAIT的原因:对方主动关闭连接或者网络...
    文章 2018-12-28 3024浏览量
  • 平台篇-58 HBase 平台实践和应用

    问题描述:在一次排查 HBase 问题的时候发现 RS 进程存在大量的 CLOSE_WAIT,最多的达到了 6000+,这个问题虽然还没有直接导致 RS 挂掉,但是也确实是个 不小的隐患。从 socket 的角度分析产生 CLOSE_WAIT 的原因:...
    文章 2019-01-14 2041浏览量
  • 响应速度不给力?解锁正确缓存姿势

    时序图所示,线程A先失效缓存数据的时候,B线程读请求发现缓存数据为空的话,就会从数据库中读取旧值放入到缓存中,这样就导致后续的读请求读到的都是缓存中的脏数据。针对这样的情况可以采用延时双删的策略来有效...
    文章 2019-12-09 891浏览量
  • 基于HBase和Spark构建企业级数据处理平台

    阿里云的一个用户之前基于Greenplum构建数据仓库,但是当数据量增大之后就会遇到很多问题,比如Greenplum运行数据量比较大的Join、Group By等操作会导致集群挂掉,并且集群扩容速度也会变慢。因此,该客户希望通过...
    文章 2019-04-01 6681浏览量
  • 企业级数据可视化应用有哪些机遇与挑战?

    时序图智能方面的技术,图数据的应用对金融领域来说实在太重要了,不管是风控、推荐还是反洗钱等都需要用到图数据,蚂蚁不仅有图数据库 Geabase,有金融知识图谱平台,还有大量的图分析应用,这部分的需求我们用 G6 ...
    文章 2020-11-04 1146浏览量
  • 流量暴增,掌门教育如何基于 Spring Cloud Alibaba ...

    当一台或者几台同步服务器挂掉后,采用 Zookeeper 临时节点的 Watch 机制监听同步服务器挂掉情况,通知剩余同步服务器执行 reHash,挂掉服务的工作由剩余的同步服务器来承担。通过一致性 Hash 实现被同步的业务服务...
    文章 2020-09-10 612浏览量
  • 有赞实时任务优化:Flink Checkpoint 异常解析与应用...

    以下是 Flink Checkpoint 触发的时序图: 当 Flink 作业状态由创建到运行时,CheckpointCoordinator 中的 ScheduledThreadPoolExecutor 会定时执行 ScheduledTrigger 中的逻辑。ScheduledTrigger 本质就是一个 ...
    文章 2020-03-11 1081浏览量
  • 有赞实时任务优化:Flink Checkpoint 异常解析与应用...

    以下是 Flink Checkpoint 触发的时序图: 当 Flink 作业状态由创建到运行时,CheckpointCoordinator 中的 ScheduledThreadPoolExecutor 会定时执行 ScheduledTrigger 中的逻辑。ScheduledTrigger 本质就是一个 ...
    文章 2020-03-11 632浏览量
  • 58同城数据库架构设计思路(下)

    58同城保证“写”高可用的方法:“双主”当“主从”用,不做读写分离,在“主”挂掉的情况下,“从”(其实是另外一个主),顶上,如下 优点:读写都到主,解决了一致性问题;“双主”当“主从”用,解决了可用性...
    文章 2019-08-12 871浏览量
  • 微服务架构上云最佳实践

    说到这里可能有同学已经猜出来了是怎么回事了,这里我简单简述一下造成这个问题的原因,首先要从服务器端主动关闭连接的 TCP TIMEWAIT 状态开始说起,顾名思义,这个状态是在等,等什么呢?确保 Server 的最后一个 ...
    文章 2017-08-01 8146浏览量
  • 基于Redis的分布式锁真的安全吗?...

    在上面的时序图中,假设锁服务本身是没有问题的,它总是能保证任一时刻最多只有一个客户端获得锁。上图中出现的lease这个词可以暂且认为就等同于一个带有自动过期功能的锁。客户端1在获得锁之后发生了很长时间的GC ...
    文章 2017-05-16 2190浏览量
  • MongoShake——基于MongoDB的跨数据中心的数据复制...

    MongoShake还提供了Hypervisor机制用于在服务挂掉的时候&xff0c;将服务重新拉起。过滤 提供黑名单和白名单机制选择性同步db和collection。压缩 支持oplog在发送前进行压缩&xff0c;目前支持的压缩格式有gzip,zlib,或...
    文章 2018-06-22 29450浏览量
  • 2016全球最强数据库大盘点

    MongoDB 也是一个天生支持分布式的数据库,数据自动分片,还支持MapReduce,也内置了一个分布式文件系统GridFS,另外可以接多种存储引擎,这些都是非常诱人的功能。MongoDB3.4 2016年MongoDB发布了3.4版本,也有...
    文章 2017-01-10 8286浏览量
  • 饿了么技术往事(下)

    系统了可以恢复,各数据中心节点间数据发生不一致的话,数据订正的成本很高。多数据中心架构实施后的几年里面,发生过一次 DRC(我们的数据复制服务)变更引入的bug,导致同步出错,好在影响的数据库实例范围可控...
    文章 2020-11-26 2656浏览量
  • 蚂蚁金服开源 SOFAJRaft:生产级 Java Raft 算法库

    其他各种奇葩原因导致 raft 节点无法正常工作 9.Workaround when quorate peers are dead:多数派故障时,整个 grop 已不具备可用性,安全的做法是等待多数节点恢复,只有这样才能保证数据安全;但是如果业务更加...
    文章 2019-03-14 4649浏览量
  • Facebook TSDB论文翻译

    时间序列支持15秒的间隔粒度(即每分钟每个时序序列有4个点) 数据存储在2个不同的副本中(容灾能力) 即使某个服务器了也能持续提供读取 能快速扫描内存中的所有数据 每年能支撑最少两倍的业务增长 本文的第3节,...
    文章 2017-08-18 2052浏览量
  • 蚂蚁金服开源 SOFAJRaft:生产级 Java Raft 算法库

    其他各种奇葩原因导致 Raft 节点无法正常工作 Workaround when quorate peers are dead:多数派故障时,整个 group 已不具备可用性,安全的做法是等待多数节点恢复,只有这样才能保证数据安全;但是如果业务更加追求...
    文章 2019-08-01 1411浏览量
  • 如何做到全年配送 0 故障?盒马揭秘 12个关键技术

    涉及DTS、diamond、tair、作业DB、降级DB等存储和中间件,链路非常长,我们绘制了一张o2o智能调度时序图,基于同一张大图,产品、技术、测试、算法能在大促和系统变更前评估系统稳定性风险。三、稳定性因素分析和...
    文章 2020-02-18 555浏览量
  • 不懂 ZooKeeper?没关系,这一篇给你讲的明明白白

    Zookeeper 通过这种节点唯一的特性,可以创建一个 Master 节点,其他客户端 Watcher 监控当前 Master 是否存活,一旦 Master 了,其他机器再创建这样的一个 Master 节点,用来重新选举。软负载均衡 分布式系统中,...
    文章 2020-09-15 1633浏览量
  • 如何带领团队“攻城略地”?优秀的架构师这样做

    先根据业务流程,分解出系统时序图,根据时序图开始对模块进行归纳,从而得到粒度更大的模块,模块的组合/聚合构建整个系统架构。基本上应用逻辑架构的推导有4个子路径,他们分别是: 业务概念架构:业务概念架构...
    文章 2019-07-03 16117浏览量
  • 如何做好一名稳定性SRE-业务团队系统稳定性的思与行

    主动梳理团队的业务时序、核心链路流程、流量地图、依赖风险,通过这个过程明确链路风险,流量水位,时序冗余;治理。主动组织风险治理,将梳理出来的风险,以专项的形式治理,防患于未然。演练。把风险化成攻击,...
    文章 2020-10-26 3284浏览量
  • 车联网上云最佳实践(二)

    为云上应用架构。1、云上对标架构介绍 1.1安全:安全这块以前IDC机房的时候防范能力比较弱。为了解决安全防御瓶颈,我们改用云上云盾+DDOS高防IP+web应用防火墙+堡垒机;可以通过配置DDoS高防IP,将攻击流量...
    文章 2018-08-31 3349浏览量
1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化