• 自动化运维Kubernetes

    持续集成(CI)工作流程是不同的用户和项目拥有其各自不同的需求和表现的地方。所以,Kubernetes 支持分层 CI 工作流程,却并不监听每层的工作状态。允许用户自行选择日志、监控、预警系统。(Kubernetes 提供一些集成...
    文章 2018-12-18 3976浏览量
  • 阿里内核月报2014年5月-06月

    长久以来,重启操作系统来安装一个内核补丁一直是一个烦人的事情。很多时候,重启系统的时机会受到其他条件的限制。此外,用户则更希望能够在不重启系统的情况下完成内核补丁的安装工作。2008年为了迎合这一需求...
    文章 2017-06-06 1782浏览量
  • 【云栖大会】阿里云首席架构师唐洪:飞天,互联网规模...

    并且在这个世界上只有一份飞天在跑,而且我想说的是跟传统的操作系统不一样的是,传统的操作系统在升级硬件时,它是需要重启的,但我们在升级飞天的时候是不可以重启的,也就是说飞天具备在持续运行的时候就能够扩展...
    文章 2016-10-20 8310浏览量
  • 人人都在谈论的云原生到底是什么?...

    它提供了一些强大的功能,例如容器之间的负载均衡,重启失败的容器以及编排容器使用的存储。容器生态图/作者:Jimmy Song   容器为云原生应用程序增加了更多优势。使用容器,你可以将微服务及其所需的所有配置、...
    文章 2019-12-12 1900浏览量
  • 阿里集团搜索和推荐关于效率&稳定性的思考和实践

    调度系统通过rolling机制加上最小可用度保证在任何情况(发布、重启)下服务的可用性。 通过智能的弹性伸缩,来动态适应业务流量的变化。对于特定的运营活动可能产生的突发流量,业务方可以提前录入其活动起止时间...
    文章 2018-02-11 5031浏览量
  • 基于容器的全链路运维平台实践

    首先什么是 EWS,EWS 是针对互联网应用提供的系统构建、发布、持续集成、运维管理的一站式解决方案。就可以说当你研发完成之后,所有的上线、运维都可以在这个平台里面完成的。首先我们来看一下,一个通常的运维系统...
    文章 2017-10-25 3177浏览量
  • DockOne微信分享(六十五):公有云上的容器实践分享

    分享中还包括对于云平台本身高可靠、高性能、持续发布、服务注册发现等方面的设计方案,以及后续的发展愿景及规划,旨在与大家探讨一些关于Docker、Kubernetes、CoreOS、Hystrix等具体技术的实践经验,同时希望大家...
    文章 2017-10-11 1078浏览量
  • 技术干货|阿里云基于Hudi构建Lakehouse实践探索「内...

    数据湖形式有结构化、结构化、非结构化&xff0c;要分析就必须要做一定的提炼、挖掘&xff0c;才能真正把数据价值用起来。四个存储方向有各自的领域&xff0c;同时又有关联分析诉求&xff0c;主要就是要打破数据孤岛&xff0c;让...
    文章 2021-09-03 530浏览量
  • 18个PPT,29个提问解答,都在这儿啦!

    为期一天的 Flink Forward 中文精华版在北京、上海、杭州三地进行联动直播,吸引了全球近 20000 人次开发者在线观看。除优质内容外,Flink Forward 精华版还首次开创问题征集,在线观看直播的同学可及时对嘉宾分享...
    文章 2020-04-28 877浏览量
  • 开放下载!18个PPT,29个提问解答,都在这儿啦!

    为期一天的 Flink Forward 中文精华版在北京、上海、杭州三地进行联动直播,吸引了全球近 20000 人次开发者在线观看。除优质内容外,Flink Forward 精华版还首次开创问题征集,在线观看直播的同学可及时对嘉宾分享...
    文章 2020-04-28 16890浏览量
  • 阿里内核月报2017年01月

    kexec 可以用于从第一个内核切换到第二个内核,它用了 kexec_load()这个系统调用,把新内核加载到内存中,然后用 reboot()系统调用快速重启;用户态也有一个 kexec 命令,可以加载新内核然后启动之。由于 kexec 跳过...
    文章 2017-06-07 2661浏览量
  • Delta Lake,让你从复杂的Lambda架构中解放出来

    比如说,业务是不能接受小时或者一个小时这种延迟的。那么,这个时候,大家自然而然会选择最经典的架构,Lambda 架构。就是说,你同时可以部署一个批处理的和一个流处理的,批可以慢一点,但是结果全面准确,而流...
    文章 2020-03-09 2347浏览量
  • 阿里云弹性计算研发团队如何从0到1自建SRE体系

    有了变更流程和规范只是第一步,接着我们针对高频率的运维操作做了工具化建设,其中有部分和现有的 DevOps 平台合作,游离在现 DevOps 之外的部分我们都自己做了研发支持,比如日志清理以及进程自动重启,并开发了...
    文章 2021-06-08 648浏览量
  • 唐端荣|DSP投放引擎的设计与实现

    支持灵活的AB实验:为持续优化CTR值,必须支持小流量实验,所以在不能影响正常业务运行的同时,要求支持动态、插拔式的算法实验;满足数据时效要求:数据时效考虑2点,1是指要实时响应广告主操作指令,比如暂停、...
    文章 2017-08-01 2927浏览量
  • 如何通过 Serverless 技术降低微服务应用资源成本?

    举例:如果每天的上午 9 点是业务高峰,可以定时每天 8 点增加实例数量,并在 9 点减少实例数量。基于指标阈值的弹性机制:对于超出预期的业务流量突增,可以设置基于指标阈值的弹性策略,根据 CPU、内存等资源...
    文章 2020-10-28 8756浏览量
  • 带你读《企业私有云建设指南》之二:企业云计算涉及的...

    如果一个信息系统本身无资源调度需求(如资源使用曲线较为平稳),或计划由云计算承载的信息系统整体资源规模较小,资源共享和调度的空间有限,又或者特定的应用系统不支持分布式部署,无法进行横向扩展甚至纵向扩展...
    文章 2019-10-31 2818浏览量
  • 通过Serverless技术降低微服务应用资源成本

    举例:如果每天的上午9点是业务高峰,可以定时每天8点增加实例数量,并在9点减少实例数量。2、基于指标阈值的弹性机制:对于超出预期的业务流量突增,可以设置基于指标阈值的弹性策略,根据CPU、内存等资源指标...
    文章 2020-10-14 5754浏览量
  • 扩展 GRTN:云原生趋势下的 RTC 架构演进

    持续的增长和全球 Top1&xff0c;这不是结束&xff0c;而是一个新的开始。我们认为只有公众号订阅的开发者超过 100K&xff0c;才能有机会提升了整个视频行业开发者的创造力。只有达到 100K 的 Star&xff0c;才能叫互联网视频的...
    文章 2021-04-23 268浏览量
  • 阿里内核月报2014年7月-8月

    这种情况延续到了类Unix系统Linux,一直持续到Linux3.4在prctl()中加入了PR_SET_CHILD_SUBREAPER选项.它允许限制子进程退出组.一个进程停止时,它的子进程被这时这个选项的进程继承. V6 Unix中的另一种控制组,是进程...
    文章 2017-06-06 2741浏览量
  • 1269道Java技术答疑,阿里技术专家帮你Java技术进阶

    云栖社区邀请到6位Java技术...随着netflix的不开源问题,下一步应该怎么选择?https://yq.aliyun.com/ask/480232@talishboy为什么springMVC框架向后兼容性那么差?我把JDK从7升级到JDK8,就报错了,找不到类和方法。...
    文章 2018-11-22 4925浏览量
  • 终于等到你!阿里正式向 Apache Flink 贡献 Blink ...

    此外Blink还引入新的调度架构,容许开发者根据计算模型自身的特点定制不同调度器。为了优化性能,Blink可以让算子更加灵活的chain在一起,避免了不必要的数据传输开销。在Pipeline Shuffle模式中,使用了ZeroCopy...
    文章 2019-01-28 25998浏览量
  • 告别“臃肿”,选择微服务(文末福利)

    Spring Cloud作为Java语言的微服务框架,它依赖于Spring Boot,有快速开发、持续交付和容易部署等特点。Spring Cloud的组件非常多,涉及微服务的方方面面,并在开源社区Spring和Netflix、Pivotal两大公司的推动下...
    文章 2018-03-23 2976浏览量
  • 如何做好一名稳定性SRE-业务团队系统稳定性的思与行

    SRE模型是Google对Dev+Ops模型的一种实践和拓展(可以参考《Google运维解密》一书),SRE这个概念我比较喜欢,因为这个词不简单是两个概念的叠加,而是一种对系统稳定性、高可用、团队持续迭代和持续建设的体系化...
    文章 2020-10-26 4794浏览量
  • 数仓实时化改造:Hudi on Flink 在顺丰的实践应用

    Grafana 也会整合到我们的实时计算平台产品里面来,在面对存量的情况时,不需要重启用户的任务,就能够直接做数据采集。但在面对增量情况时,就需要补充一些 Metric,比如 CPU 使用率、内存的使用率等。这部分我们以...
    文章 2021-01-05 1101浏览量
  • 玩转ECS第3讲|ECS自助服务之智能诊断和自动化修复

    专家经验是基于案例库和知识库抽象出来的各种逻辑规则,比如ECS启动失败原因可能是库存原因、调度原因、块存储、控制侧异常、Guest OS启动异常、底层虚拟化异常等。专家决策和决策树会依次排查可能的原因,下图中每...
    文章 2020-10-28 3175浏览量
  • 这些年,我工作上走过的路

    没想到的是,我竟然因此和搜索结缘,一直持续到今天。创业征途 突然来的机遇就是这么神奇,也让人感觉莫名其妙,说来就来了,你真的不知道为什么会来,但真的就是这么来了。当机遇来临的时候,常常让人懊悔的是抓...
    文章 2016-09-09 2866浏览量
  • 饿了么技术往事(下)

    后面很多看起来轻而易举的事情 —— 午高峰线上故障容灾、全面上云、全站底层容器及调度系统的升级等等 —— 没有这次架构演进将会很艰难。体会和教训: 多数据中心——多数据中心核心解决高可用诉求和容量带来的...
    文章 2020-11-26 4403浏览量
  • 专访阿里云 Serverless 负责人:无服务器不会让后端...

    典型的离线任务批处理系统,例如大规模音视频文件转码服务,包含计算资源管理、任务优先级调度、任务编排、任务可靠执行、任务数据可视化等一系列功能。如果从机器或者容器层次开始构建,用户通常使用消息队列进行...
    文章 2020-12-03 4433浏览量
  • 阿里内核月报2014年4月

    Snitzer:提醒大家注意一下,我们关心的不是那些硬件设备对DISCARD命令的真实支持情况到底怎么样,它可能支持,可能不支持,眼下咱们没能力关心,咱们关心的仅仅是把这个命令传到dm-thin这一层,让dm-thin知道哪块...
    文章 2017-06-06 1614浏览量
  • 应用运维智能化的关键技术——《应用智能运维实践...

    异常持续一段时间后可能被判定为正常。xff08;3&xff09;其业务曲线自身可能有规律性的陡增和陡降。xff08;4&xff09;其过于敏感&xff0c;容易误报&xff0c;因为方差会随着异常点的引入而变大&xff0c;所以很难使用连续三点才告...
    文章 2021-07-06 449浏览量
1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化