元乙_个人页

个人头像照片 元乙
个人头像照片 个人头像照片 个人头像照片
65
1
0

个人介绍

阿里云日志服务数据采集客户端负责人,目前采集客户端logtail在集团百万规模部署,每天采集上万应用数PB数据,经历多次双11双12考验。

擅长的技术

  • Java
  • 前端开发
  • Linux
  • 数据库
获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

阿里云技能认证

详细说明
暂无更多信息

2023年11月

2022年01月

  • 01.10 11:18:34
    发表了文章 2022-01-10 11:18:34

    简单、有效、全面的Kubernetes监控方案

    近年来,Kubernetes作为众多公司云原生改造的首选容器化编排平台,越来越多的开发和运维工作都围绕Kubernetes展开,保证Kubernetes的稳定性和可用性是最基础的需求,而这其中最核心的就是如何有效地监控Kubernetes集群,保证整个集群的一个良好的可观察性。本期将为大家介绍Kubernetes的监控方案。

2021年12月

  • 12.13 14:35:42
    发表了文章 2021-12-13 14:35:42

    可观测监控方案大全-SLS全栈监控

    为了便于用户快速接入和监控业务系统,SLS提供了全栈监控的APP,将各类监控数据汇总到一个实例中进行统一的管理和监控。全栈监控基于SLS的监控数据采集、存储、分析、可视化、告警、AIOps等能力构建。
  • 12.07 19:44:31
    发表了文章 2021-12-07 19:44:31

    打造Java可观测性的5个关键步骤

    伴随云原生和微服务的普及,可观测性设计基本上是作为一个线上业务服务必备的基础能力。这篇文章我将介绍天罡项目围绕可观测性的三大支柱:日志,指标以及链路追踪所做的可观测性设计和实践,以及项目中实施可观测性的5个关键步骤。

2021年11月

  • 11.29 11:54:21
    发表了文章 2021-11-29 11:54:21

    Trace告警配置最佳实践

    阿里云日志服务(SLS)提供了Log,Metric,Trace等三种数据快速接入的能力,同时也提供了丰富的分析功能和可定制化的Dashboard的能力,客户可以利用SLS快速的搭建可观测性平台,让用户更加关注于分析,降低用户接入各类数据的门槛。本文主要讲述应用接入SLS Trace服务后,针对各种场景化如何配置告警。
  • 11.28 21:48:10
    发表了文章 2021-11-28 21:48:10

    阿里可观测性数据引擎的技术实践

    非常有幸参加了QCon上海站的可观测分会场,并和大家分享阿里在可观测性数据引擎的一些思考和技术实践,本文主要是对于分享的文字整理。
  • 11.17 21:01:30
    发表了文章 2021-11-17 21:01:30

    Kubernetes日志采集原理全方位剖析

    本文将主要介绍SLS对于Kubernetes日志采集的基本原理,便于大家在实践中能够更好的规划使用方式。

2021年09月

  • 09.02 10:22:23
    发表了文章 2021-09-02 10:22:23

    Jaeger插件开发及背后的思考

    本文主要介绍Jaeger最新的插件化后端的接口以及开发方法,让大家能够一步步的根据文章完成一个Jaeger插件的开发。此外SLS也推出了对于Jaeger的支持,欢迎大家试用。

2021年08月

  • 08.09 11:36:57
    发表了文章 2021-08-09 11:36:57

    使用SLS Trace实现Jaeger的高可靠部署方案

    Jaeger的高可用最核心的部分是Jaeger后端(包括Collector、Kafka、Flink、DB、Query、UI),我们最好的方式是寻找一个能够兼容Jaeger的后端系统,提供高可靠、高性能的能力。而SLS最近发布的Trace服务恰巧可以完美解决这个问题。SLS最大的一个特点就是高性能、弹性和免运维,让用户轻松应对激增流量或者规模评估不准确的问题,SLS服务本身提供99.9%的可用性以及11个9的数据可靠性。
  • 08.09 11:34:18
    发表了文章 2021-08-09 11:34:18

    Pull or Push?监控系统如何选型

    本文主要介绍了监控系统中最纠结的Pull or Push选择问题,笔者结合数年的实际经验以及遇到的各类客户场景对Pull和Push的各类方向进行了比对,仅供大家在监控系统建设过程中参考,也欢迎大家留言和讨论。

2021年07月

  • 07.27 16:43:07
    发表了文章 2021-07-27 16:43:07

    释放Trace的价值-SLS OpenTelemetry新功能直击痛点

    SLS在2021年4月份正式发布了对OpenTelemetry Trace 1.0版本的支持,完全兼容OpenTelemetry Trace1.0版本的所有字段,提供了Trace显示、分析、拓扑展示等功能。在功能发布后,众多客户开始接入SLS Trace并深度使用,其中对我们也提出来非常多的建议和需求。从中我们提取出了呼声最高的一些功能和优化点,加入到了SLS的Trace方案1.1版本中。
  • 07.15 14:50:43
    发表了文章 2021-07-15 14:50:43

    Apache SkyWalking接入SLS Trace实践

    Apache SkyWalking 是一款非常优秀的应用性能监控(APM)工具,对微服务、云原生和容器化应用提供自动化、高性能的监控方案。项目于 2015 年创建,并于 2017 年 12 月进入 Apache 孵化器,目前已经是Apache的顶级项目。SLS Trace已经支持Apache SkyWalking Agent端直接接入SLS Trace服务。运维人员可以直接将已经接入Apache SkyWalking的应用的Agent端直接接入到SLS Trace服务(下文会有详细说明)而不需要考虑规模和部署的问题。

2021年04月

  • 04.19 09:48:41
    发表了文章 2021-04-19 09:48:41

    助力可观察性统一平台:SLS Trace服务发布

    SLS在2015年发布了日志(Logs)方案、2020年发布了监控(Metrics),在今年2021年发布了分布式链路追踪(Traces)方案,已经正式具备了可观察性数据的统一存储、分析、可视化能力。后续除了在每个细分数据场景做深外,还会提供更加完善的数据关联方案以及AIOps的异常检测和根因分析能力。

2021年03月

  • 03.31 15:48:16
    发表了文章 2021-03-31 15:48:16

    10个特性:这才是你需要的Trace方案

    分布式链路追踪(Distributed Tracing,简称Trace)又名全链路数据追踪,为业务系统提供了整个服务调用链路的调用关系、延迟、结果等信息。本文主要介绍Trace方案的一些高级特性,让大家可以更好的使用Trace来解决业务可观察性的问题。
  • 03.10 14:58:41
    发表了文章 2021-03-10 14:58:41

    OpenTelemetry Log规范解读

    本文主要介绍OpenTelemetry Log规范,这一规范来自于Google、Microsoft、AWS、Splunk、DataDog、ES、Fluntd等众多优秀的公司和项目成员,其中有很多点是我们在平时开发、运维需要关注的知识和经验,值得大家一观。

2021年02月

  • 02.01 11:50:31
    发表了文章 2021-02-01 11:50:31

    LightStep调研

    公司由前Google工程师Ben Sigelman于2015年成立(创始人曾经是Dapper的开发者,专注于分布式链路追踪),LightStep的使命是削减软件的规模和复杂性,帮助公司能够持续保持对其系统的控制。第一个产品LightStep [x]PM能够在任何时间点提供整个软件系统准确、详细的快照,基于快照能够快速识别问题、瓶颈并解决。

2020年12月

  • 12.28 11:28:30
    发表了文章 2020-12-28 11:28:30

    解读:云原生下的可观察性发展方向

    非常有幸参加了云原生社区Meetup北京站,有机会和众多业内的大牛一起讨论云原生相关的技术和应用,本次Meetup上我和大家分享了关于云原生下的可观察性相关的议题,本篇文章主要是视频的文字性总结,欢迎大家留言讨论。
  • 12.27 20:56:27
    发表了文章 2020-12-27 20:56:27

    ClickHouse源码分析-压缩算法大揭秘

    ClickHouse在近年来增加了很多压缩算法,最主要的改进还是为了更好的适应时序场景,提高压缩率,节省存储空间。本期就给大家带来ClickHouse的压缩算法介绍。

2020年10月

  • 10.27 14:39:16
    发表了文章 2020-10-27 14:39:16

    全面提升-SLS移动端SDK2.0发布

    未来5G时代,移动端应用将会产生巨大的飞跃,借助于SLS在服务端、嵌入式端等积累的数据采集经验,我们充分吸取各个端上的优势开发了移动端SDK2.0版本,在支持众多高级功能的情况下依然能够保持高性能与低资源占用,能够满足移动端的各类数据采集需求。
  • 10.19 11:08:47
    发表了文章 2020-10-19 11:08:47

    再次升级-Kubernetes Ingress监控进入智能时代

    Ingress日志记录了Kubernetes集群所有的外部请求信息,是进行集群服务质量监控的最佳方式。目前Ingress日志分析与监控的方案已经发布2年左右,已经有上万的实例使用了该方案。为了适应新时代的DevOps节奏,我们对方案进行整体的升级,提供更加简单、更快速、更普惠、更智能的Ingress日志监控方案

2020年09月

  • 09.25 12:05:28
    发表了文章 2020-09-25 12:05:28

    解放生产力-阿里云7层负载均衡智能分析与监控

    对于7层负载均衡访问日志,阿里云SLB专门为用户开放了实时访问日志的能力,通过控制台开通后,实时的访问日志会自动推送到用户自己的SLS中,延迟只有几秒钟,并且SLB推送完全免费且不需要用户自己提供机器接受日志。推送到SLS中的日志可以借助于SLS强大的分析、可视化、监控能力,发挥访问日志的价值。
  • 09.01 12:20:36
    发表了文章 2020-09-01 12:20:36

    DevOps训练营-Kubernetes监控与分析最佳实践

    近年来,Kubernetes作为众多公司云原生改造的首选容器化编排平台,越来越多的开发和运维工作都围绕Kubernetes展开,保证Kubernetes的稳定性和可用性是最基础的需求,而这其中最核心的就是如何有效地监控Kubernetes集群,保证整个集群的一个良好的可观察性。本期将为大家介绍如何对Kubernetes开展全方位的监控与分析。

2020年08月

  • 08.20 15:10:53
    发表了文章 2020-08-20 15:10:53

    SLS时序存储发布-助力打造Log/Metric联合解决方案

    SLS新增时序存储,面向时序类数据提供一站式接入、存储、可视化、告警、智能运维等功能。方案完整支持各主流开源监控平台(Prometheus、InfluxDB等),提供低成本、免运维的监控数据存储与服务能力。
  • 08.14 11:33:38
    发表了文章 2020-08-14 11:33:38

    一步到位,服务器监控就是这么简单

    对于运维的日常工作来说,服务器监控是必须且最基础的一项内容。在企业基础设施运维过程中,管理员必须能够掌握所有服务器的运行状况,以便及时发现问题,尽可能减少故障的发生。本期为大家介绍如何使用阿里云SLS来快速构建一套完整的服务器/主机基础指标实时监控方案。

2020年07月

2020年06月

  • 06.28 10:08:25
    发表了文章 2020-06-28 10:08:25

    可观察性统一方案-SLS兼容OpenTelemetry

    可观察性(Observability)本质上是指系统可以根据外部输出推断内部运行状态的过程。近年来随着云原生技术的普及,PaaS和SaaS化的程度越来越高,传统的监控系统正在朝可观察性系统的方向演进。在这背景下OpenTelemetry诞生,OpenTelemetry为我们带来了Metric、Tracing、Logging的统一标准,便于我们构建一个统一的可观察性平台。
  • 06.18 10:46:59
    发表了文章 2020-06-18 10:46:59

    高性能、高可用、免运维-云原生Prometheus方案与实践

    SLS(阿里云日志服务)一直致力于发展成一个DevOps的数据中台,为用户提供丰富的机器数据接入、存储、分析、可视化等能力。本文主要介绍SLS如何支持Prometheus的方案,为大家提供云原生的高性能、高可用、免运维的Prometheus引擎。

2019年11月

  • 11.13 10:16:03
    发表了文章 2019-11-13 10:16:03

    系列文章:Kubernetes日志方案设计思路

    上一篇中我们介绍了为什么需要一个日志系统、为什么云原生下的日志系统如此重要以及云原生下日志系统的建设难点,相信DevOps、SRE、运维等同学看了是深有体会的。本篇文章单刀直入,会直接跟大家分享一下如何在云原生的场景下搭建一个灵活、功能强大、可靠、可扩容的日志系统。

2019年09月

  • 09.08 23:44:35
    发表了文章 2019-09-08 23:44:35

    系列文章:云原生Kubernetes日志落地方案

    越来越多的同学来咨询如何为Kubernetes构建一个日志系统或者是来求助在这过程中遇到一系列问题如何解决,授人以鱼不如授人以渔,于是我们把这些年积累的经验以文章的形式发出来,让看到这篇文章的同学能少走弯路。

2019年07月

  • 07.22 10:39:33
    发表了文章 2019-07-22 10:39:33

    OpenTelemetry-可观察性的新时代

    Ops领域两个网红项目OpenTracing和OpenCensus终于走到了一起,可观察性统一的标准化已经扬帆起航。这篇文章旨在抛砖引玉,希望能够和更多的同学一起交流可观察性相关的内容。

2019年06月

  • 06.17 22:00:44
    发表了文章 2019-06-17 22:00:44

    Kubernetes Ingress日志分析入门

    本文主要介绍如何基于日志服务构建Kubernetes Ingress日志分析平台,并提供一些简单的动手实验方便大家快速了解日志服务相关功能。

2019年05月

  • 发表了文章 2023-11-06

    从存储统一到数据融合,SLS在可观测场景的思考和行动

  • 发表了文章 2022-01-10

    简单、有效、全面的Kubernetes监控方案

  • 发表了文章 2021-12-13

    可观测监控方案大全-SLS全栈监控

  • 发表了文章 2021-12-07

    打造Java可观测性的5个关键步骤

  • 发表了文章 2021-11-29

    Trace告警配置最佳实践

  • 发表了文章 2021-11-28

    阿里可观测性数据引擎的技术实践

  • 发表了文章 2021-11-17

    Kubernetes日志采集原理全方位剖析

  • 发表了文章 2021-09-02

    Jaeger插件开发及背后的思考

  • 发表了文章 2021-08-09

    使用SLS Trace实现Jaeger的高可靠部署方案

  • 发表了文章 2021-08-09

    Pull or Push?监控系统如何选型

  • 发表了文章 2021-07-27

    释放Trace的价值-SLS OpenTelemetry新功能直击痛点

  • 发表了文章 2021-07-15

    Apache SkyWalking接入SLS Trace实践

  • 发表了文章 2021-04-19

    助力可观察性统一平台:SLS Trace服务发布

  • 发表了文章 2021-03-31

    10个特性:这才是你需要的Trace方案

  • 发表了文章 2021-03-10

    OpenTelemetry Log规范解读

  • 发表了文章 2021-02-01

    LightStep调研

  • 发表了文章 2021-01-04

    解读:云原生下的可观察性发展方向

  • 发表了文章 2020-12-28

    解读:云原生下的可观察性发展方向

  • 发表了文章 2020-12-27

    ClickHouse源码分析-压缩算法大揭秘

  • 发表了文章 2020-10-27

    全面提升-SLS移动端SDK2.0发布

正在加载, 请稍后...
滑动查看更多
  • 提交了问题 2017-04-11

    云栖社区博客发表markdown预览与发布结果不一致问题

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息