• 阿里云大数据计算平台的自动化、精细化运维之路

    这里面主要难点还是在于硬件信息收集和分析,怎么判断这块磁盘坏了怎么判断 CPU 是有问题的。这其中需要长期的数据和经验积累。这里我可以简单介绍一下我们现在采集的信息源: 硬盘主要依赖于 kernel log/smartctl...
    文章 2017-02-28 10482浏览量
  • 【干货】徐葳:如何用大数据和人工智能让云更聪明?

    比如我硬盘坏了,哪一台系统机会挂掉,这件事要用传统方法解决,至少需要20条左右的命令,而且运行在不同的机器。这些命令都是知识,一般人不知道的。而采用我们的方法,我们能够把这些零散的信息整理成一个知识网络...
    文章 2017-04-03 988浏览量
  • 清华徐葳:如何用大数据和人工智能让云更聪明?

    比如我硬盘坏了,哪一台系统机会挂掉,这件事要用传统方法解决,至少需要20条左右的命令,而且运行在不同的机器。这些命令都是知识,一般人不知道的。而采用我们的方法,我们能够把这些零散的信息整理成一个知识网络...
    文章 2017-05-02 1547浏览量
  • 阿里大规模计算平台的自动化、精细化运维之路

    这里面主要难点还是在于硬件信息收集和分析,怎么判断这块磁盘坏了怎么判断 CPU 是有问题的。这其中需要长期的数据和经验积累。这里我可以简单介绍一下我们现在采集的信息源: 硬盘主要依赖于 kernel log/smartctl...
    文章 2017-03-23 6085浏览量
  • TCP协议疑难杂症全景分析

    网络的本质作用还是“端到端”的通信,然而希望互相通信的设备并不一定要“直接”连接在一起,因此必然需要一些中间的设备负责转发数据,因此就把连接这些中间设备的线缆上跑的协议定义为链路层协议,实际上所谓链路...
    文章 2017-06-09 1497浏览量
  • TCP协议疑难杂症全景解析

    网络的本质作用还是“端到端”的通信,然而希望互相通信的设备并不一定要“直接”连接在一起,因此必然需要一些中间的设备负责转发数据,因此就把连接这些中间设备的线缆上跑的协议定义为链路层协议,实际上所谓链路...
    文章 2017-11-12 942浏览量
  • 阿里云的水晶计划

    第一是针对数据安全生命周期建立全链路保护机制。数据的全生命周期一般为6个阶段&xff0c;包括数据采集、数据传输、数据计算、数据交换、数据存储到数据销毁。黄瑞瑞告诉「甲子光年」&xff0c;几年前云厂商的宣传大多...
    文章 2021-10-26 778浏览量
  • 救火必备!问题排查与系统优化手册

    缺点:缺失客户端链路数据。对可用性数据要求较高的系统,也可以同时运用上述两种方式,建议结合你的业务场景综合评估选择。优化原则 你应该做的:关注 RT 的数据分布(如:p50/p99/p999 分位点),而不是平均值...
    文章 2020-07-13 2642浏览量
  • LC3视角:Kubernetes下日志采集、存储与处理技术实践

    在过去,各类日志用特定的方式来存储,采集到计算链路不具被通用和复用条件,pipeline非常复杂,数据存储也可能重复冗余。当前日志数据集成上,通过依赖一个中枢(Hub)来简化日志架构的复杂度、优化存储利用率。这...
    文章 2018-07-05 13624浏览量
  • 章文嵩博士和他背后的负载均衡帝国

    一个大型数据中心,每天都有机器坏了是很正常的事情,尤其是在虚拟化大行其道的今天,更是如此,相信你对虚拟主机又崩溃了一个,或者总是被同宿主机的猪一样的队友“挤”死这种情况一定不陌生。dns负载均衡的一大...
    文章 2016-05-30 9672浏览量
  • 章文嵩(正明)博士和他背后的负载均衡(LOAD ...

    一个大型数据中心,每天都有机器坏了是很正常的事情,尤其是在虚拟化大行其道的今天,更是如此,相信你对虚拟主机又崩溃了一个,或者总是被同宿主机的猪一样的队友“挤”死这种情况一定不陌生。dns负载均衡的一大...
    文章 2016-05-26 16757浏览量
  • 秋招结束面试和面经的总结(个人向)

    基本功能并发与队列一般来说,弹幕数据会通过异步请求或 socket 消息传到前端,这里会存在一个隐患——数据量可能非常大。如果一收到弹幕数据就马上渲染出来,在量大的时候:显示区域不足以放置这么多的弹幕,弹幕会...
    文章 2021-10-10 168浏览量
  • DevOps落地三部曲:如何归责?用啥工具?...

    第二种方式我们用数据库去做,有些数据库实际上是可以去存二进制的大文件的,而且它可以很方便地做Key-Value的元数据管理,但自己研发制品库的问题在于并发、高可用和快速下发。在规模较小时,这些还不是问题。它的...
    文章 2017-12-15 3275浏览量
  • 如何成为优秀的技术主管?你要做到这三点

    记录哪些信息,最好打印一定的上下文(链路TraceId、用户Id、订单Id、外部传来的关键数据)而不仅仅是打印线程栈。记录了上下问信息,是否要考虑日志脱敏问题?可以在框架层面实现,比如自定义实现logback的...
    文章 2019-02-27 13873浏览量
  • 独家揭秘:阿里巴巴Zeus资源调度系统

    机器的磁盘、内存条、网卡,随时都会掉,统计概率大约是万分之三,一旦掉了,进入维修流程。1万台规模,每天来个3、5台,一个礼拜也就20多台,再花个1个礼拜慢慢修复。修复了,回归可用资源池又是一段时间。这种...
    文章 2019-07-30 2827浏览量
  • 独家揭秘:阿里巴巴Zeus资源调度系统

    机器的磁盘、内存条、网卡,随时都会掉,统计概率大约是万分之三,一旦掉了,进入维修流程。1万台规模,每天来个3、5台,一个礼拜也就20多台,再花个1个礼拜慢慢修复。修复了,回归可用资源池又是一段时间。这种...
    文章 2016-04-29 10784浏览量
  • 带你读《网络防御与安全对策:原理与实践(原书第3版...

    ICMP数据包使用Internet控制消息协议(Internet Control Message Protocol,ICMP)在Internet上发送错误消息。因为数据包发送的地址是广播地址,所以该地址通过将数据包发送到网络上的所有主机进行响应,然后这些...
    文章 2019-11-06 813浏览量
  • C++笔试题目大全(笔试宝典)(不断完善中)

    由于 malloc/free 是库函数而不是运算符,不在编译器控制权限之内,不能够把执行构造函数和析构函数的任务强加于 malloc/free。因此 C++ 语言需要一个能完成动态内存分配和初始化工作的运算符 new,以及一个能完成...
    文章 2017-08-30 1507浏览量
  • 重构:改善饿了么交易系统的设计思路

    那么Python呢,任何事物都有双刃剑,虽然Python具有强表达力,但是灵活性也把很多人惯坏了,代码写的糙,动态语言写太多坑也多,容易出错,在大项目上的工程管理和维护上有一定劣势,所以rails作者提到:“灵活性被...
    文章 2019-09-20 10264浏览量

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化