• 关于

    信息收集挂掉的原因

    的搜索结果
  • CacheCloud bug修复日志

    CacheCloud从3月17日正式开源,虽然在我们内部一直运行正常,开源后虽然没有大的问题,但还是遇到很多小问题,比如操作系统兼容性问题,数据库版本问题,一些配置不灵活等等问题。 期间感谢大家的反馈,现在将CacheCloud修复的问题列出来,希望将来这个能一直更新下去,有问题去github i...

    文章 付磊-起扬 2016-04-06 895浏览量

  • Windows XP \Windows 2003启动过程的学习及故障分析处理(六D)

    Windows XP \Windows 2003启动过程的学习及故障分析处理                                      (六D) 细述引导文件(D)——NTDETECT.COM NTDETECT.COM NTDETECT.COM硬件侦测程序。他在会NTLDR...

    文章 科技小能手 2017-11-14 789浏览量

  • 9、epoll其他花絮

        epoll是做为一个虚拟文件系统来实现的,这样做至少有以下两个好处: 1、可以在内核里维护一些信息,这些信息在多次epoll_wait间是保持的,比如所有受监控的文件描述符。 2、epoll本身也可以被poll/epoll;     【1】epoll的实现中,所等待的设备...

    文章 hopegrace 2011-09-03 540浏览量

  • [收集整理]root=LABEL=/与root=/dev/hda2有什么区别?

     title Red Hat Linux (2.4.22)         root (hd0,1)         kernel /boot/vmlinux-2.4.20 ro root=LABEL=/        initrd /boot/initrd-2.4.20.img  我来说一下这个...

    文章 berryz2007 2010-12-12 539浏览量

  • 阿里云栖开发者沙龙PHP技术专场-聊聊服务稳定性保障这些事

    摘要:本文主要带大家了解服务稳定性的重要性和相关策略。策略大概分两部分,第一方面从架构层面介绍保障服务稳定性的常见策略(限流,降级,隔离,超时,重试和集群)。第二个方面是从流程方面(code review, 压测,灰度和监控)讲解怎么去保证稳定性。 演讲嘉宾简介:信海龙(花名沧龙),十余年的互联网...

    文章 PHP小能手 2019-04-25 2246浏览量

  • 阿里数据库性能诊断的利器——SQL全量性能数据

    概述 在业务数据库调优过程中,如果数据库能记录执行过的每个SQL的性能信息,那对应用诊断性能异常问题会很有帮助。传统商业数据库在这方面做了一些探索。 如ORACLE的AWR或ASH视图里记录的SQL都是参数化的SQL,并且还有去重。所以不能准确关联到有问题的业务SQL上。ORACLE的诊断思路是如...

    文章 mq4096 2019-05-04 1546浏览量

  • ElasticDL:蚂蚁金服开源基于TensorFlow的弹性分布式深度学习系统

    9 月 11 日,蚂蚁金服在2019谷歌开发者大会上海站上开源了 ElasticDL 项目,这是业界首个基于 TensorFlow 实现弹性深度学习的开源系统。 开源地址为:elasticdl.org 开源中国采访了ElasticDL项目负责人王益,对该深度学习系统的技术细节进行了全面介绍。 ...

    文章 缪克卢汉 2019-09-11 850浏览量

  • 流量暴增,掌门教育如何基于 Spring Cloud Alibaba 构建微服务体系?

    作者 | 童子龙  掌门教育基础架构部架构师 导读:本文整理自作者于 2020 年云原生微服务大会上的分享《掌门教育云原生落地实践》,本文主要介绍了掌门教育云原生落地实践,主要围绕 Spring Cloud Alibaba & Nacos & Sentinel & Arth...

    文章 阿里巴巴云原生小助手 2020-09-10 529浏览量

  • zookeeper OOM问题排查

    背景 最近折腾的数据库同步项目中,大量使用了zookeeper(版本3.3.3),可以说是强依赖,但是最近频频出现zookeeper内存使用率达到100%,而且是GC不掉,直接导致整个系统挂起,伤不起阿   分析 因为大部分的情况都是无法GC回收,所以很大程度上怀疑出现memory leak。 设...

    文章 愤怒的苹果 2016-03-30 3386浏览量

  • 咱们从头到尾说一次 Java 的垃圾回收

    阿里妹导读:之前上学的时候有一个梗,说在食堂里吃饭,吃完把餐盘端走清理的是 C++ 程序员,吃完直接就走的是 Java 程序员。确实,在 Java 的世界里,似乎我们不用对垃圾回收那么的关注。很多初学者不懂 GC,也能写出一个能用甚至还不错的程序或系统。但其实这并不代表 Java 的 GC 就不重...

    文章 技术小能手 2019-08-20 10387浏览量

  • 从JAVA多线程理解到集群分布式和网络设计的浅析

    由于最近工作原因,很久没有在CSDN上留下些啥,今天在这些篇文章,是关于java多线程的。 对于JAVA多线程的应用非常广泛,现在的系统没有多线程几乎什么也做不了,很多时候我们在何种场合如何应用多线程成为一种首先需要选择的问题,另外关于java多线程的知识也是非常的多,本文中先介绍和说明一些常用的...

    文章 钟隐 2011-04-29 1815浏览量

  • 惊魂48小时,阿里工程师如何紧急定位线上内存泄露?

    作者 | 朱云锋 1、问题初现 该风险隐患在2019年10月下旬某天开始浮现,不到24小时的时间里,值班同学陆续收到多个线上电话报警,显示某业务集群中分布式协调服务进程异常: 14:04:28,报警显示一台Follower意外退出当前Quorum,通过选举重新加入Quorum;16:06:35,报...

    文章 檸,铮 2019-12-20 96浏览量

  • 怎么才能保证你的敏捷团队不会被指标毁掉

    我认为敏捷社区要改变评测敏捷团队是否成功的方法。我们收集指标以及从这些指标中获取信息的方法实际上妨碍了我们做出能用的软件,而这才是最重要的东西。   强推个体指标有时会导致过于关注其他人,影响团队的协作。这会歪曲我们要评测的内容,摧毁我们的真实意图。   在我看来主要有两个问题:   观察者效应:...

    文章 青衫无名 2017-07-03 1102浏览量

  • zookeeper 大量连接断开重连原因排查

    问题现象 最后发现线上的zookeeper的日志zookeeper.out 文件居然有6G,后来设置下日志为滚动输出,参考: http://blog.csdn.net/hengyunabc/article/details/19006911 但是改了之后,发现一天的日志量就是100多M,滚动日志一天...

    文章 横云断岭 2014-11-24 2474浏览量

  • zookeeper 大量连接断开重连原因排查

    问题现象 最后发现线上的zookeeper的日志zookeeper.out 文件居然有6G,后来设置下日志为滚动输出,参考: http://blog.csdn.net/hengyunabc/article/details/19006911 但是改了之后,发现一天的日志量就是100多M,滚动日志一天...

    文章 hengyunabc 2014-11-24 11945浏览量

  • iOS应用的crash日志的分析基础

    Outline如何获得crash日志如何解析crash日志如何分析crash日志     1. iOS策略相关     2. 常见错误标识     3. 代码bug一、如何获得crash日志当一个iOS应用程序崩溃时,系统会创建一份crash日志保存在设备上。这份crash日志记录着应用程序崩溃时...

    文章 思禽 2014-02-10 2065浏览量

  • Android ANR优化 2

    在实际情况中,当Android项目的用户量特别大时候,一些细小的问题也会被放大,ANR问题就是一个典型的例子。 一些ANR问题只会发生在用户实际使用的情景,当系统资源比较紧张等一些特殊情况下才会遇到,而这些ANR问题有很大一部分是因为我们的代码不合理导致,这就需要我们定位问题,修复问题,并且在以后...

    文章 技术小胖子 2017-11-08 1072浏览量

  • 转 Kafka设计理念浅析

    本文将从以下两个方面去尝试讲解Kafka的设计理念,主要参考文献在这里: Kafka设计背景及原因 Kafka的设计特色 Kafka设计背景及原因 Kafka最初被LinkedIn设计来处理活动流数据(activity stream data)和系统处理数据(operaitonal ...

    文章 cloudcoder 2016-05-13 2280浏览量

  • 徐葳:生物医学影像处理、分布式系统与数据共享平台

    徐葳:谢谢组织者的邀请,我不是做图形图像的,我是做分布式系统的,这是我的简要经历。 我一方面在做科研,另一方面在做实践,我现在管着300台服务器,我的一些设计、想法都使得这些设备的运维变得更加容易。 首先看一个图,我们做计算机系统的人脑海中存在的系统是长成这个样子的。 今天讲影像我完全是客串...

    文章 小旋风柴进 2017-05-02 998浏览量

  • ElasticDL: Kubernetes-native 弹性分布式深度学习系统

    9月11日,蚂蚁金服在 Google Developer Day Shanghai 2019 上宣布开源了基于 TensorFlow 2.0 eager execution 的分布式深度学习系统 ElasticDL。基于 TensorFlow 的支持弹性调度的深度学习系统,据我们所知,Elasti...

    文章 缪克卢汉 2019-09-12 6157浏览量

  • Spring Cloud Turbine(集群监控)

    简介: Turbine是聚合服务器发送事件流数据的一个工具,Hystrix的监控中,只能监控单个节点,实际生产中都为集群,因此可以通过Turbine来监控集群下Hystrix的metrics情况Turbine的github地址:https://github.com/Netflix/Turbine ...

    文章 ben4 2018-08-07 2735浏览量

  • docker~swarm搭建docker高可用集群

    Swarm概念   Swarm是Docker公司推出的用来管理docker集群,它将一群Docker宿主机变成一个单一的,虚拟的主机。Swarm使用标准的Docker API接口作为其前端访问入口,换言之,各种形式的Docker Client(docker client in Go, docker...

    文章 mcy247 2017-12-05 2327浏览量

  • 蚂蚁金服轻量级监控分析系统解析 | SOFAChannel#6 直播整理

    ,有趣实用的分布式架构频道。本文根据 SOFAChannel#6 直播分享整理,主题《轻量级监控分析系统 SOFALookout 原理讲解和功能演示》。 回顾视频以及 PPT 查看地址见文末。欢迎加入直播互动钉钉群:23195297,不错过每场直播。 大家好,我是来自蚂蚁金服响风,SOFALo...

    文章 初商 2019-07-31 575浏览量

  • Apache Spark3.0什么样?一文读懂Apache Spark最新技术发展与展望

    2019阿里云峰会·上海开发者大会于7月24日盛大开幕,在本次峰会的开源大数据专场上,阿里巴巴高级技术专家李呈祥带来了《Apache Spark 最新技术发展和3.0+ 展望》的全面解析,为大家介绍了Spark在整体IT基础设施上云背景下的新挑战和最新技术进展,同时预测了Spark 3.0即将重磅...

    文章 社区助手 2019-08-01 2394浏览量

  • Apache Spark3.0什么样?一文读懂Apache Spark最新技术发展与展望

    2019阿里云峰会·上海开发者大会于7月24日盛大开幕,在本次峰会的开源大数据专场上,阿里巴巴高级技术专家李呈祥带来了《Apache Spark 最新技术发展和3.0+ 展望》的全面解析,为大家介绍了Spark在整体IT基础设施上云背景下的新挑战和最新技术进展,同时预测了Spark 3.0即将重磅...

    文章 阿里云E-MapReduce团队 2019-08-02 2637浏览量

  • Apache Spark3.0什么样?一文读懂Apache Spark最新技术发展与展望

    2019阿里云峰会·上海开发者大会于7月24日盛大开幕,在本次峰会的开源大数据专场上,阿里巴巴高级技术专家李呈祥带来了《Apache Spark 最新技术发展和3.0+ 展望》的全面解析,为大家介绍了Spark在整体IT基础设施上云背景下的新挑战和最新技术进展,同时预测了Spark 3.0即将重磅...

    文章 开源大数据EMR 2019-08-02 4077浏览量

  • 蚂蚁金服轻量级监控分析系统解析 | SOFAChannel#6 直播整理

    蚂蚁金服轻量级监控分析系统解析 | SOFAChannel#6 直播整理 SOFA:Channel/,有趣实用的分布式架构频道。本文根据 SOFAChannel#6 直播分享整理,主题:轻量级监控分析系统 SOFALookout 原理讲解和功能演示。回顾视频以及 PPT 查看地址见文末。欢迎加入直...

    文章 s潘潘 2019-06-28 1066浏览量

  • 阿里搜索事业部故障快速恢复实践

    这篇文章中,我们将讨论面对故障时,我们为什么选择快速切流这种机制。如果选择快速切流,我们需要具备哪些条件,需要切流平台解决什么样的问题。最后,我们畅想故障快速恢复未来如何做的更好。 一、关于故障的几种解决思路 如何定义故障 我们一般从以下几个维度来定义故障。一是影响的用户数量,例如用户投...

    文章 卢占一十力 2018-03-16 2372浏览量

  • 我是如何处理大并发量订单处理的 KafKa部署总结

    今天要介绍的是消息中间件KafKa,应该说是一个很牛的中间件吧,背靠Apache 与很多有名的中间件搭配起来用效果更好哦 ,为什么不用RabbitMQ,因为公司需要它。    网上已经有很多怎么用和用到哪的内容,但结果很多人都倒在了入门第一步 环境都搭不起来,可谓是从了解到放弃,所以在此特记录如何...

    文章 最美的回忆 2017-11-22 1815浏览量

  • 吴军:机器智能时代,如何成为最先受益的2%?

    【导语】:2016年11月13日,第二届万物互联创新大会「创业下一潮水:大数据与智能时代」在杭州召开。丰源资本创始合伙人、前腾讯副总裁、《浪潮之巅》作者吴军博士发表了演讲。 吴军博士介绍了当今机器智能的水平,分析了智能时代到来的原因,并在最后分享了其认为的未来时代,“未来我们说的万物互联网,或者...

    文章 小旋风柴进 2017-05-31 1367浏览量

1 2 3 4 5 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT