• 独家揭秘:微博深度学习平台如何支撑4亿用户愉快吃瓜...

    模型预测,这是深度学习框架重要的环节,因为微博的业务场景需求,对并发量和延时性要求都是比较敏感的,这张图显示的是模型服务的整体框架,主要分为三层。第一层是集群调度层,模型服务现在线上有 CPU、也有 GPU ...
    文章 2020-12-31 1275浏览量
  • 玩转ECS第3讲|ECS自助服务之智能诊断和自动化修复

    接下来,进行数据处理,特征数据进入到实时预测模型中,进行非预测宕机模型、可预测宕机模型、混合模型、高准确率、高召回模型;下一步进入投票模型,投票到各种各样的优先级的sls预测数据中,当precision大于50%时...
    文章 2020-10-28 3175浏览量
  • 迟来的flag,至今已有672名学长靠这套Java八股文成功...

    10、力扣算法1、x的平方根2、删除排序数组中的重复项3、斐波那契数列4、环形链表5、二叉树遍历6、合并两个有序数组7、Dota2参议院8、寻找数组的中心索引9、二叉树的最小深度10、反转链表11、预测赢家12、井字游戏13...
    文章 2021-11-20 12浏览量
  • 分布式主动感知在智能运维中的实践

    我们把自动化的每个动作都抽象成一个原子(atom),比如重启服务、重启机器、修改配置,这些atom通过StackStrom建立成一个个的工作流,这些工作流是我们有经验的运维专家建立的一个更高级抽象、更语义化的模型。...
    文章 2019-07-09 2303浏览量
  • 语雀在线表格自研之路

    2019年5月我们决定重启表格的研发,抛开 Spreadjs,全面自研,自研给我们带来的底层的可控性,拓展性,而且从长期看,自研的综合成本效率都很优,选择自研你要慎重的考虑以下几个因素:包括:模型,体验,性能,研发...
    文章 2020-07-27 1935浏览量
  • 面向容器的资源调度技术对比

    然后梳理资源共享各种不同共享形式的内容,接着对比任务类型,最后回到资源利用率和基于数据预测角度,看相关系统是如何运用和实现各自场景目标。最后给出阿里巴巴电商在线服务资源调度器Zeus关键技术内容。进入这个...
    文章 2017-06-28 4303浏览量
  • 阿里、Google、Twitter面向容器的资源调度技术比较

    然后梳理资源共享各种不同共享形式的内容,接着对比任务类型,最后回到资源利用率和基于数据预测角度,看相关系统是如何运用的和实现各自场景目标的。最后给出阿里巴巴电商在线服务资源调度器Zeus关键技术内容。具体...
    文章 2017-05-02 3642浏览量
  • 面向容器技术资源调度关键技术对比(作者:阿里中间件...

    然后梳理资源共享各种不同共享形式的内容,接着对比任务类型,最后回到资源利用率和基于数据预测角度,看相关系统是如何运用的和实现各自场景目标的。最后给出阿里巴巴电商在线服务资源调度器Zeus关键技术内容。具体...
    文章 2016-04-27 7152浏览量
  • 带你读《并发模式与应用实践》之一:并发简介

    如果这些程序都不能并行运行,很难想象人们怎么工作。随着时间的推移,软件占用的内存变得越来越大,需要更多更快的CPU。例如,现在的数据库事务每秒都在增加,数据处理需求超出了任何一台机器的能力,因此,人们...
    文章 2019-11-04 1333浏览量
  • 《深入理解大数据:大数据处理与编程实践》一一1.3 ...

    MapReduce的主要功能MapReduce通过抽象模型和计算框架把需要做什么(What need to do)与具体怎么做(How to do)分开了,为程序员提供了一个抽象和高层的编程接口和框架,程序员仅需要关心其应用层的具体计算问题,...
    文章 2017-07-04 1847浏览量
  • 一个复杂系统的拆分改造实践

    这里的核心问题就是tair/redis这层资源的使用不可预测,因为依赖于接口的qps,怎么让请求变得可预测呢?如果我们再增加一层本地缓存(guava,比如超时时间设置为1秒),保证单机对一个key只有一个请求回源,那样对...
    文章 2017-01-04 7709浏览量
  • 独家揭秘:阿里巴巴Zeus资源调度系统

    这种时间窗口越短,对任务切换要求能力更高,需要资源实时预测模型。例如 Borg系统,针对进程最近时刻内存开销进行实时调整。这对C、C++是有益处的,而对java就很难快速实施了,因为需要改JVM参数,从而JVM需要重启...
    文章 2019-07-30 2413浏览量
  • Serverless 可观测性的过去、现在与未来

    图 7-监控中心示例4)扩展编程模型,集成三方监控函数实例的生命周期完全由平台控制,用户无法控制实例的启动与回收,也不感知实例的暂停与重启,这就使得在函数计算上执行除主线程外的背景线程格外困难。...
    文章 2021-04-02 377浏览量
  • 架构选型之Nodejs与Java

    与其他项目组的同事聊项目选型Java时被他们嘲笑了一把,怎么这么不与时俱进怎么还在用Java。而且发现,越来越多的前端同事通过Nodejs轻松上手后端功能开发,作为后端开发工程师倍感压力。借新项目的机会系统了解了下...
    文章 2016-06-07 20890浏览量
  • Apache Flink在 bilibili 的多元化探索与实践

    后期则是通过了模型的定义和管理,以及它的开发来组织的,主要是通过在平台的入口提供给用户去录制每一条流、每个表,它的 Schema,Schema 会将它生成 Protobuf 的文件,用户可以在平台上去下载 Protobuf 对应的 ...
    文章 2021-05-14 1540浏览量
  • 超大规模商用 K8s 场景下,阿里巴巴如何动态解决容器...

    例如,目前每个控制器仅负责一种 cgroup 资源的控制,即在同一时间窗口内,Policy engine 不同时调整多种资源,以免造成资源分配震荡,干扰调整效果;触发规则稳定性。例如,某一条规则的原始触发条件为容器的性能...
    文章 2019-10-12 11361浏览量
  • 独家揭秘:阿里巴巴Zeus资源调度系统

    这种时间窗口越短,对任务切换要求能力更高,需要资源实时预测模型。例如 Borg系统,针对进程最近时刻内存开销进行实时调整。这对C、C++是有益处的,而对java就很难快速实施了,因为需要改JVM参数,从而JVM需要重启...
    文章 2016-04-29 10478浏览量
  • Flink 1.12 资源管理新特性回顾

    对于这种情况需要进行作业重启,在重启的过程中需要重新申请资源和重启 TaskManager 进程,这种性能消耗代价是非常高昂的。对于稳定性要求相对比较高的作业,Flink1.12 提供了一个新的 feature,能够支持在 Flink ...
    文章 2021-07-15 1429浏览量
  • 应用运维智能化的关键技术——《应用智能运维实践...

    我们需要从当前可用的统计、机器学习、人工智能和自治控制技术堆栈中匹配相关的算法。总的来说&xff0c;当前能够匹配企业应用运维场景、可以用来解决实际运维问题的技术有面向海量实时指标数据的异常检测、发现异常后...
    文章 2021-07-06 449浏览量
  • 阿里万亿交易量级下的秒级监控

    这是 Sunfire 的功能结构,比较重要是 Sunfire-lika 模块,它用来支撑整个计算框架的,就是线程模型、消息调度处理、故障自愈恢复都是通过这个模块实现的。1.4、Sunfire 架构 这是 Sunfire 架构图。这个架构图是怎么...
    文章 2017-12-07 5997浏览量
  • Redis性能问题排查解决手册(七)

    上述二种做法对控制连接数的数量和持续保持Redis的性能最优是非常重要的, 4.加强内存管理:较少的内存会引起Redis延迟时间增加。如果Redis占用内存超出系统可用内存,操作系统会把Redis进程的一部分数据,从物理...
    文章 2016-09-14 1668浏览量
  • 使用 Kubernetes 和 OpenStack-Salt,打造生产环境...

    因此,你必须启用这样的构建和运维工具:杂乱的脚本(重启服务或修改配置)、手动维护、局限知识(只有特定的人才知道如何管理生产服务)。理想的运维工作流包含下列术语,如可重复模式、单一信任源(基础设施即代码...
    文章 2017-10-12 1994浏览量
  • Serverless 可观测性的过去、现在与未来

    也不感知实例的暂停与重启&xff0c;这就使得在函数计算上执行除主线程外的背景线程格外困难。监控探针就是诸多重要的背景线程的一种。FC 扩展了编程模型&xff0c;发布 Runtime LifeCycle 功能&xff0c;Runtime LifeCycle ...
    文章 2021-03-16 687浏览量
  • MapReduce原理与设计思想

    通过抽象模型和计算框架把需要做什么(what need to do)与具体怎么做(how to do)分开了为程序员提供一个抽象和高层的编程接口和框架 程序员仅需要关心其应用层的具体计算问题仅需编写少量的处理应用本身计算问题的...
    文章 2016-04-21 2947浏览量
  • 再不关注“实时物联网(RT-IoT)”,你就老了!

    FogHorn Lightning ML仅有256MB大小,使得机器学习模型能够运行在计算能力高度受限的边缘设备上,例如PLC、工业PC、Raspberry Pi系统和多种IoT网关。2.Sight Machine http://sightmachine.com/ 只要看过Sight ...
    文章 2018-02-08 1523浏览量
  • Unix网络编程 3rd vol1 读书笔记

    学习笔记目的 此文档记录本人学习Unix Network Programming 3rd verion volumn I的一些笔记,我只将觉得重要或经过一番功夫才理解的内容记录下来,方便以后回顾。第二章 传输层TCP,UDP和SCTP ...
    文章 2017-09-13 767浏览量
  • MapReduce原理与设计思想(转载:...

    通过抽象模型和计算框架把需要做什么(what need to do)与具体怎么做(how to do)分开了为程序员提供一个抽象和高层的编程接口和框架 程序员仅需要关心其应用层的具体计算问题仅需编写少量的处理应用本身计算问题的...
    文章 2017-06-02 1864浏览量
  • Flink as a Unified Engine:Now and Next

    流批一体数据集成流批一体不只是一个技术上的问题,我想更详细的解释一下流批一体架构到底怎么去改变在不同典型场景下的数据处理的方式和数据分析的架构。我们先看第一个,在大数据场景下经常需要数据同步或者数据...
    文章 2021-01-20 2103浏览量
  • 云原生体系下的技海浮沉与理论探索

    结合可靠的自动化手段,云原生技术使工程师能够轻松地对系统作出频繁和可预测的重大变更。云原生计算基金会(CNCF)致力于培育和维护一个厂商中立的开源生态系统,来推广云原生技术。通过将最前沿的模式民主化,让...
    文章 2020-12-14 1065浏览量
  • 云原生体系下的技海浮沉与理论探索

    结合可靠的自动化手段,云原生技术使工程师能够轻松地对系统作出频繁和可预测的重大变更。云原生计算基金会(CNCF)致力于培育和维护一个厂商中立的开源生态系统,来推广云原生技术。通过将最前沿的模式民主化,让...
    文章 2020-12-01 5875浏览量
1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化