• 关于

    线上算法挂掉的原因

    的搜索结果
  • 阿里云栖开发者沙龙PHP技术专场-聊聊服务稳定性保障这些事

    摘要:本文主要带大家了解服务稳定性的重要性和相关策略。策略大概分两部分,第一方面从架构层面介绍保障服务稳定性的常见策略(限流,降级,隔离,超时,重试和集群)。第二个方面是从流程方面(code review, 压测,灰度和监控)讲解怎么去保证稳定性。 演讲嘉宾简介:信海龙(花名沧龙),十余年的互联网...

    文章 PHP小能手 2019-04-25 2165浏览量

  • 底层原理:垃圾回收算法是如何设计的?

    如果大家关注 JDK,会发现在频繁发布的 JDK 版本中,和垃圾回收相关的 JEP (JDK Enhancement Proposals,Java 增强提案)越来越多了,垃圾回收(Garbage Collection,GC)正处于方兴未艾的阶段。譬如,在 JEP-248 中 G1 替代了并行垃圾回...

    文章 茶什i 2020-11-05 1608浏览量

  • 技术如何秒懂你?阿里百万级QPS资源调度系统揭秘

    理想情况下,TPP平台上的场景owner不需要关注底层的资源分配情况,平台尽可能的提高CPU利用率,同时保证平台上场景的稳定。QPS(每秒查询率)增加的时候扩容,QPS减少的时候缩容,未来这些在夜间被拿掉的机器可以用来混部离线任务等;另外,在2016年双11的时候,总的机器数目不足以维持所有的场景...

    文章 技术小能手 2017-12-19 7056浏览量

  • 徐葳:生物医学影像处理、分布式系统与数据共享平台

    徐葳:谢谢组织者的邀请,我不是做图形图像的,我是做分布式系统的,这是我的简要经历。 我一方面在做科研,另一方面在做实践,我现在管着300台服务器,我的一些设计、想法都使得这些设备的运维变得更加容易。 首先看一个图,我们做计算机系统的人脑海中存在的系统是长成这个样子的。 今天讲影像我完全是客串...

    文章 小旋风柴进 2017-05-02 984浏览量

  • 还不知道AIOps嘛?阿里这么火的智能运维,你不能不知道!

    摘要:业务通过产品技术发挥价值的一个必要条件就是可以在线上稳定持续的运行,这一直是运维人员的终极目标。相信大家在使用天猫、淘宝、支付宝时几乎没有遇到过无法使用的情况,阿里是如何做到的呢?AIOps又是什么?本文主要关注线上业务的研发和运维流程,由阿里云高级技术专家向大家介绍如何将机器学习算法引入运...

    文章 聒小小噪 2018-05-30 10527浏览量

  • ApsaraDB-HBase双集群和稳定性

    摘要:在2018年1月25日的数据库直播上由阿里云HBase team的玄陵带来了以“ApsaraDB-HBase双集群和稳定性”为主题的分享,通过对云HBase双集群方案存在的必要性、常见跨集群数据复制方案、云HBase跨集群数据复制(增量/全量)、云HBase双集群方案选择以及云HBase服务...

    文章 smile小太阳 2018-01-30 8200浏览量

  • 掌门教育微服务体系 Solar | 阿里巴巴 Nacos 企业级落地中篇

    联席作者:吴毅挺 任浩军 童子龙 郑重鸣谢:Nacos - 彦林,Spring Cloud Alibaba - 小马哥、洛夜,Nacos 社区 - 张龙(pader)、春少(chuntaojun) 掌门教育自 2014 年正式转型在线教育以来,秉承“让教育共享智能,让学习高效快乐”的宗旨和愿景,经...

    文章 中间件小哥 2020-08-03 657浏览量

  • 最近分布式系统开发小结: Slave模块Executors设计

    更新一段我在linkedin上对这个项目的描述,目前项目已经开发完在使用了。本文并不是最新的设计。 背景解决HDFS/Hive/RDBMS/FTP/MongoDB等数据源之间的批量数据同步问题特性跨机房场景下的链路优化;多路输入和输出的任务模型;数据容错和可持久化;任务失败恢复任务调度把任务配置解...

    文章 张包峰 2014-01-07 1373浏览量

  • 阿里巴巴高级算法专家威视:组建技术团队的一些思考

    本文是我从2019年1月底接手CRO线NLP算法团队以来,在团队组建、能力建设、以及管理上的一些思考,全部是没有科学论证的主观判断,不过都进行了实践。我没有任何管理学背景知识,把拙见没羞没臊地写出来,是为了抛砖引玉,和同学们交流讨论。 团队的定位是什么?——做正确的事 定位 团队的定位是重要的事情...

    文章 中间件小哥 2019-12-27 600浏览量

  • 如何健壮你的后端服务?

    对每一个程序员而言,故障都是悬在头上的达摩克利斯之剑,都唯恐避之不及,如何避免故障是每一个程序员都在苦苦追寻希望解决的问题。对于这一问题,大家都可以从需求分析、架构设计 、代码编写、测试、code review、上线、线上服务运维等各个视角给出自己的答案。本人结合自己两年有限的互联网后端工作经验,...

    文章 力君 2015-12-04 5325浏览量

  • 掌门教育微服务体系 Solar | 阿里巴巴 Nacos 企业级落地中篇

    联席作者:吴毅挺 任浩军 童子龙郑重鸣谢:Nacos - 彦林,Spring Cloud Alibaba - 小马哥、洛夜,Nacos 社区 - 张龙(pader)、春少(chuntaojun) 相关文章推荐: 掌门教育微服务体系 Solar | 阿里巴巴 Nacos 企业级落地上篇 前言 在高速...

    文章 阿里巴巴云原生小助手 2020-08-03 291浏览量

  • 35岁技术人如何转型做管理?阿里高级算法专家公开10大思考

    作者 | 威视 因为信任,所以简单。 团队的定位是什么?——做正确的事 定位 团队的定位是重要的事情之一,一旦有了偏差,后续做得越多错得越多。确定团队的定位花了我很长时间,中间还发生了一次组织变化,和两任主管有多次讨论。 首先,这个团队配置在 CRO 线,肯定要为风险管理业务服务;同时,这又是一支...

    文章 檸,铮 2020-01-17 1719浏览量

  • 阿里巴巴高级算法专家威视:组建技术团队的一些思考

    本文是我从2019年1月底接手CRO线NLP算法团队以来,在团队组建、能力建设、以及管理上的一些思考,全部是没有科学论证的主观判断,不过都进行了实践。我没有任何管理学背景知识,把拙见没羞没臊地写出来,是为了抛砖引玉,和同学们交流讨论。 团队的定位是什么?——做正确的事 定位 团队的定位是重要的事情...

    文章 中间件小哥 2019-12-27 1873浏览量

  • 流量暴增,掌门教育如何基于 Spring Cloud Alibaba 构建微服务体系?

    作者 | 童子龙  掌门教育基础架构部架构师 导读:本文整理自作者于 2020 年云原生微服务大会上的分享《掌门教育云原生落地实践》,本文主要介绍了掌门教育云原生落地实践,主要围绕 Spring Cloud Alibaba & Nacos & Sentinel & Arth...

    文章 阿里巴巴云原生小助手 2020-09-10 465浏览量

  • 再快0.8秒!天猫工程师如何用千人千面优化启动速度?

    ​背景 长久以来,随着App版本的迭代,各项性能指标都会随着业务的迭代,代码的堆叠而出现逐渐下滑的趋势。以手机天猫Android9.1.0版本为例,整体启动耗时一直在增长。其中50多个启动任务在首页加载之前就需要初始化,再加上首页复杂的业务逻辑,进一步地增加了app启动的耗时,这样就极大地影响到了...

    文章 檸,铮 2020-02-28 331浏览量

  • 使用Flume Log4j Appender正确的姿势

    使用Flume Log4j Appender正确的姿势 我们使用Flume-ng的LoadBalancingLog4jAppender,将线上服务的日志实时传输到日志服务器,转交给告警系统和HDFS做存储。 FLume的Log4j Appender必须使用Log4j的异步加载器,否则一旦日志服务器...

    文章 edwardsbean 2014-01-25 2041浏览量

  • 我读过的书籍 - 2015

    2015 2.10          系统化学习这本书的原因很简单,在写Maven Dependency Mediator这个开源插件的时候,希望能做的和开源社区诸如Ning那些组件不同,系统研究了Maven 2和3的源码,学习了Gradle这套编译体系,后来发现Gradle冲突检测这块实现上...

    文章 沙加10 2015-04-01 1667浏览量

  • 从清华到阿里,他只用6年时间,影响了数亿用户

    “阿里技术直播”,是专为技术人量身制作的视频直播节目,旨在分享行业前沿趋势、技术干货和技术人生。今天为大家送上阿里资深算法专家靖世的精彩直播内容。 大家好,我名字叫盖坤,在阿里花名叫靖世。之前在清华大学读的本科跟博士,专业是机器学习跟人工智能。毕业之后一直在阿里巴巴做广告算法,现在在阿里妈妈负责竞...

    文章 技术小能手 2017-08-18 8585浏览量

  • 如何做到全年配送 0 故障?盒马揭秘 12个关键技术

    一 、稳定大于一切 盒马的线下作业稳定性要求极高,假如门店pos无法付款了,排起的支付长队伍能让人把门店闹翻,假如配送员无法揽收了,在家里预定的午餐材料的饥肠辘辘的客户能把投诉电话打爆,甚至会形成广泛的社会舆论。盒马安全生产至关重要,稳定大于一切。​盒马配送智能调度负责将订单指派给骑手,是配送作业...

    文章 檸,铮 2020-02-18 462浏览量

  • ElasticDL: Kubernetes-native 弹性分布式深度学习系统

    9月11日,蚂蚁金服在 Google Developer Day Shanghai 2019 上宣布开源了基于 TensorFlow 2.0 eager execution 的分布式深度学习系统 ElasticDL。基于 TensorFlow 的支持弹性调度的深度学习系统,据我们所知,Elasti...

    文章 缪克卢汉 2019-09-12 6124浏览量

  • 阿里妈妈基于TensorFlow做了哪些深度优化?TensorFlowRS架构解析

    一. 综述 深度学习比传统的逻辑回归有着更强的模型刻画能力,同时也带来了计算力百倍提升的需求。相比图像、语音、视频等领域,搜索、广告、推荐等场景有着独特的场景特点: 样本规模和特征空间通常非常巨大,千亿样本、百亿特征并不罕见,同时存在大量的稀疏特征作为Embedding输入。这就要求我们针对此场景...

    文章 技术小能手 2018-04-26 5671浏览量

  • 从分布式一致性算法到区块链共识机制

    引言 分布式一致性是一个很“古典”的话题,即在分布式系统中,如何保证系统内的各个节点之间数据的一致性或能够就某个提案达成一致。这个问题想必对于很多技术同学而言并不陌生,几乎在所有的分布式系统中都会遇到,比如hdfs、mq、zookeeper、kafka、redis、elasticsearch等。然...

    文章 海阔 山遥 2019-05-13 2179浏览量

  • 线上服务的FGC问题排查,看这篇就够了!

    GC的运行原理介绍 先前分享了一篇GC问题案例分析 一次线上JVM调优实践,FullGC40次/天到10天一次的优化过程 JVM调优实战:解决CMS concurrent-abortable-preclean LongGC的问题 整个案例的分析过程中,其实涉及到很多GC的原理知识,如果不懂得这...

    文章 码农架构 2020-11-09 241浏览量

  • 阿里移动|《蚂蚁金服移动端高可用技术实践》

    摘要:对于移动技术而言,2017年是继往开来之年。一方面是移动技术领域进入深水区,另一方面移动技术边界和内涵被不断重塑。阿里巴巴希望进一步推动移动应用研发事实标准落地,从而赋能整个行业开发者。在2017年杭州云栖大会上,蚂蚁金服高级技术专家竹光为大家分享了蚂蚁金服移动端在高可用技术方面的具体实践。...

    文章 场景研读 2017-12-07 1628浏览量

  • 【智驾深谈】Tesla致命车祸的必然性:谈自动驾驶的三个命门

    一个“量身定做”的事故 首先我们先来复盘一下整个事故,谈一下为什么我们觉得这个事故是“量身定做”而且必然的。先总结:一如既往蓝天白云且风和日丽的天气,一辆横在路上的白色重卡,一个热衷尝试新技术且对此深信不疑的驾驶员,一条笔直到让人犯困的公路,一套尚在完善的自动驾驶系统,车-路-人联手为新锐车企Te...

    文章 知与谁同 2017-08-03 982浏览量

  • 企业级数据可视化应用有哪些机遇与挑战?

    作者 | 林峰 在前不久的上海外滩大会上,蚂蚁集团资深技术专家林峰分享了企业级数据可视化应用的机遇与挑战,以及蚂蚁是如何实践的,我们将内容整理出来与大家分享。 大家好,很荣幸有机会能在这给大家做个分享,今天准备的主题叫做“企业级数据可视化应用的机遇与挑战”,偏向于设计体验和工程实现,主要来自于过...

    文章 温柔的养猫人 2020-11-04 471浏览量

  • 单机和分布式场景下,有哪些流控方案?

    一 流控的场景 流控的意义其实无需多言了。最常用的场景下,流控是为了保护下游有限的资源不被流量冲垮,保证服务的可用性,一般允许流控的阈值有一定的弹性,偶尔的超量访问是可以接受的。 有的时候,流控服务于收费模式,比如某些云厂商会对调用 API 的频次进行计费。既然涉及到钱,一般就不允许有超出阈值的调...

    文章 茶什i 2020-06-24 832浏览量

  • 从JAVA多线程理解到集群分布式和网络设计的浅析

    由于最近工作原因,很久没有在CSDN上留下些啥,今天在这些篇文章,是关于java多线程的。 对于JAVA多线程的应用非常广泛,现在的系统没有多线程几乎什么也做不了,很多时候我们在何种场合如何应用多线程成为一种首先需要选择的问题,另外关于java多线程的知识也是非常的多,本文中先介绍和说明一些常用的...

    文章 钟隐 2011-04-29 1800浏览量

  • 回顾《网易数据基础平台建设》

    分享嘉宾:蒋鸿翔 网易 数据科学中心 首席架构师内容来源:DataFun Talk《网易数据基础平台建设》 首先简单介绍一下网易杭州研究院情况简介,如下图所示: 我们公司主要从事平台技术开发和建设方面,工作的重点方向主要在解决用户在数据治理中的各种问题,让用户能更高效地管理自己的数据,进而产生...

    文章 开源大数据EMR 2020-02-04 146浏览量

  • 回顾《网易数据基础平台建设》

    分享嘉宾:蒋鸿翔 网易 数据科学中心 首席架构师内容来源:DataFun Talk《网易数据基础平台建设》 首先简单介绍一下网易杭州研究院情况简介,如下图所示: 我们公司主要从事平台技术开发和建设方面,工作的重点方向主要在解决用户在数据治理中的各种问题,让用户能更高效地管理自己的数据,进而产生...

    文章 开源大数据EMR 2020-02-05 314浏览量

1 2 3 4 6 >

云产品推荐

阿里云企业服务平台 陈四清的老板信息查询 上海奇点人才服务相关的云产品 爱迪商标注册信息 安徽华轩堂药业的公司信息查询 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 天籁阁商标注册信息 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 北京芙蓉天下的公司信息查询