• 400+节点的 Elasticsearch 集群运维

    不幸的是,当集群宕机的时候,不到三分之一的查询能成功完成。我们相信测试本身导致了集群宕机。—— 摘录自使用真实查询在新ES集群平台上的第一次性能测试 为了控制查询执行过程,我们开发了一个插件,实现了一系列...
    文章 2019-04-18 1809浏览量
  • 400+节点的 Elasticsearch 集群运维

    不幸的是,当集群宕机的时候,不到三分之一的查询能成功完成。我们相信测试本身导致了集群宕机。—— 摘录自使用真实查询在新ES集群平台上的第一次性能测试 为了控制查询执行过程,我们开发了一个插件,实现了一系列...
    文章 2019-03-12 996浏览量
  • Uber是如何使用MySQL设计可扩展性数据存储的?

    如果凌晨3点我们接到叫车请求,但是这时数据存储无法响应查询,导致业务宕机,我们是否有相关操作知识可以快速解决这个问题。鉴于以上种种,我们分析了几种常用的选择的优势和潜在的限制,比如Cassandra、Riak、...
    文章 2017-05-02 1870浏览量
  • 一文看懂 kafka 机制

    或选择第一个“活”过来的Replica(不一定是ISR中的)作为Leader),这个broker宕机的事情,kafka controller也会通知zookeeper,zookeeper就会通知其他的kafka broker。如果这个kafka broker controller宕机了,在...
    文章 2018-07-09 7712浏览量
  • 扶凯:海量视频和用户时代的CDN

    并且当机器出现宕机时可在4层路由上就迅速屏蔽宕机信息。每一台机器分为两个部分:控制部分与OCT的Cache软件。控制部分进行逻辑处理以对CDN公司的海量客户控制管理和功能逻辑处理,例如请求过来以后是从路径中一部分...
    文章 2018-08-24 1387浏览量
  • 微服务(Microservices)—Martin Flower【翻译】...

    目前,这种架构方式还没有准确的定义,但是在围绕业务能力的组织、自动部署(automated deployment)、端智能(intelligence in the endpoints)、语言和数据的分散控制,却有着某种共同的特征。“微服务...
    文章 2016-05-05 4425浏览量
  • 微服务(Microservices)—Martin Fowler【翻译】

    目前,这种架构方式还没有准确的定义,但是在围绕业务能力的组织、自动部署(automated deployment)、端智能(intelligence in the endpoints)、语言和数据的分散控制,却有着某种共同的特征。“微服务...
    文章 2016-03-26 6963浏览量
  • 智能、互联时代的应用运维——《应用智能运维实践...

    汽车的电子车身稳定装置、加速防滑控制系统、防抱死制动系统、刹车辅助系统等可实现车控制&xff0c;简化用户的操控&xff1b;某些高端车提供的通过手机App控制锁车、开关车窗和空调等的控制能力提升了用户体验&xff1b;...
    文章 2021-07-06 361浏览量
  • 带你读《智能制造之卓越设备管理与运维实践》之一:...

    内燃机的发明解决了交通工具的发动机问题,运输类设备迎来了巨大的发展空间。在20世纪50年代之前,设备主要依靠电力或内燃机提供动力。随着技术的改良和进步,设备效率不断提升,加工速度不断提高。但制造过程中,...
    文章 2019-11-08 1395浏览量
  • Cassandra 在 360 的实践与改进

    ❷ Cassandra 使用最终一致性策略,而非 HBase 的强一致性策略,配合读写策略的处理,Cassandra 可以在确保数据安全性、可靠性、一致性的前提下,出现节点宕机而不需要恢复时间,集群读写不产生任何停顿,而此场景下...
    文章 2019-12-30 418浏览量
  • 《架构真经:互联网技术架构的设计原则(原书第2版)...

    1999年6月宕机事件后的几个月里,eBay的网站又接二连三地出现了几次不同规模的宕机,尽管引起每次宕机的原因有所不同,但是,问题的根源都指向该网站无法应付空前急剧增长的大量用户请求。这些宕机事件彻底改变了该...
    文章 2017-05-02 2259浏览量
  • 《架构真经:互联网技术架构的设计》大道至简

    1999年6月宕机事件后的几个月里,eBay的网站又接二连三地出现了几次不同规模的宕机,尽管引起每次宕机的原因有所不同,但是,问题的根源都指向该网站无法应付空前急剧增长的大量用户请求。这些宕机事件彻底改变了该...
    文章 2017-05-19 3408浏览量
  • kafka、zookeeper 集群(一)

    kafka的设计初衷是希望作为一个统一的信息收集平台,能够实时的收集反馈信息,并需要能够支撑较大的数据量,且具备良好的容错能力. 1、持久性 kafka使用文件存储消息,这就直接决定kafka在性能上严重依赖文件系统的本身...
    文章 2017-11-26 1139浏览量
  • 突破关系型数据库桎梏:云原生数据库中间件核心剖析

    使用多主多从的方式,不但能够提升系统的吞吐量,还能够提升系统的可用性,可以达到在任何一个数据库宕机,甚至磁盘物理损坏的情况下仍然不影响系统的正常运行。读写分离本质上是数据分片的一种。与将数据根据分片键...
    文章 2018-11-07 1901浏览量
  • Java高质量面试总结

    说说最有成就感的一项任务深入考察的技术点:Java框架:Spring源码的AOP和IOCJDK:ConcurrentHashMap如何提高并发度NIO的原理,包括零拷贝,堆外内存以及优缺点虚拟:包冲突,类冲突的形成原理以及解办法,可以引申到JDK 9...
    文章 2021-11-28 7浏览量
  • 浅谈分布式存储系统Pangu2.0——它让双11运维变得智能...

    该过程中存在精准流控,能够反复权衡流量的使用,保证复制的同时前端用户的I/O依旧维持在可用度很高的状态,并采取并行复制的方法在半小时内完整恢复单台宕机的全部数据,从而尽可能的淡化影响。前文中,我们讲了...
    文章 2017-12-15 5163浏览量
  • 寻找 K8s 1.14 Release 里的“蚌中之珠”

    容错性差,如果pod正在运行的宿主机宕机或者磁盘发生异常,那么它的持久化卷里的信息可能丢失 第一个问题,可以通过比如阿里云的 local-volume-provisioner 实现本地 SSD Nvme实例自动创建数据卷来解决,但对于容错...
    文章 2019-03-28 9206浏览量
  • 十问|关于Service Mesh 和Kubernets的最前沿思考

    另外,因为中间件相比应用来说,会有更多的状态,而且也有不同的系统角色,在处理不同角色的扩容或是宕机恢复的时候,也需要考虑更多状态信息。以前每个中间件基本上是自己要在 PaaS 上去定制这部分的逻辑,复杂度和...
    文章 2018-07-24 1982浏览量
  • Redis常见知识点汇总 也许你能用到

    然而如果在写入的过程中出现系统崩溃,如电源故障导致的宕机,那么此时也许只有部分数据被写入到磁盘,而另外一部分数据却已经丢失。Redis服务器会在重新启动时执行一系列必要的一致性检测,一旦发现类似问题,就会...
    文章 2019-11-20 1525浏览量
  • Redis 21问,你接得住不?

    然而如果在写入的过程中出现系统崩溃,如电源故障导致的宕机,那么此时也许只有部分数据被写入到磁盘,而另外一部分数据却已经丢失。Redis服务器会在重新启动时执行一系列必要的一致性检测,一旦发现类似问题,就会...
    文章 2021-11-04 10浏览量
  • Redis 21问,你接得住不?

    然而如果在写入的过程中出现系统崩溃,如电源故障导致的宕机,那么此时也许只有部分数据被写入到磁盘,而另外一部分数据却已经丢失。Redis服务器会在重新启动时执行一系列必要的一致性检测,一旦发现类似问题,就会...
    文章 2021-11-05 13浏览量
  • Redis常见知识点汇总 也许你能用到

    实现方式:set 的内部实现是一个 value永远为null的HashMap,实际就是通过计算hash的方式来快速排重的,这也是set能提供判断一个成员是否在集合内的原因。5)Sorted Set 常用命令:zadd/zrange/zrem/zcard等;应用...
    文章 2020-02-23 1124浏览量
  • 面试题有哪些

    ​使用int的原因是,对于当下32位的处理器(CPU)来说,一次处理数据是32位(这里不是指的是32/64位系统,而是指CPU硬件层面),具有高效存取的特点。标识符的命名规则?标识符的含义 是指在程序中,我们自己定义的...
    文章 2021-10-07 62浏览量
  • Redis学习总结-《我的Java打怪日记》

    动态扩容的原因&xff1a;redis对速度的要求苛刻&xff0c;如果使用c语言的string,每次修改字符串长度都需要重新分配一次内存&xff0c;十分耗时。list列表对象的编码可以是ziplist或者linkedlist。当满足以下两个条件时&xff0...
    文章 2021-07-17 11225浏览量
  • 带你读《Flink原理、实战与性能优化》之一:Apache ...

    在任务执行过程中,能够自动发现事件处理过程中的错误而导致数据不一致的问题,比如:节点宕机、网路传输问题,或是由于用户因为升级或修复问题而导致计算服务重启等。在这些情况下,通过基于分布式快照技术的...
    文章 2019-11-01 5867浏览量
  • Linux集群和自动化运维

    3.2 选择Python的原因83 3.3 Python的版本说明83 3.4 增强的交互式环境IPython84 3.5 Python(x,y)介绍85 3.6 轻量级自动化运维工具Fabric介绍86 3.6.1 Fabric的安装87 3.6.2 命令行入口fab命令详解88 3.6.3 ...
    文章 2017-05-02 5184浏览量
  • 实时数仓入门训练营:实时数仓助力互联网实时决策和...

    这还只是表面的问题,对于分析师来说更痛苦,他需要使用不同的数据,访问不同的系统,学习不同的接口,甚至是有不同的访问控制机制,这对分析师来说就非常不方便。因此,很多公司都要搭一套所谓的数据中台,通过中台...
    文章 2021-07-14 1455浏览量

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化