一年前,小丁加入了一家初创公司,准备大干一番
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_3ecea6b4a69248d2bd72783632f19631.png?x-oss-process=image/resize,w_1400/format,webp)
刚加入公司,业务规模小,使用少量云主机就可以满足需求了
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_6b28fd33c3634477bdb6f8fc7fb74a53.png?x-oss-process=image/resize,w_1400/format,webp)
最初,业务刚上线,问题比较多;小丁通过ssh+grep的方法,有效抓住了大部分初期的bug,简单高效
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_ef0e9e8757634d5486c1d1ad1f83ef5f.png?x-oss-process=image/resize,w_1400/format,webp)
过了一段时间,公司的业务获得了巨大成功,一开始的那些机器数,快顶不住压力了
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_729b04dc0ed4484dad7b569ab139a9d0.png?x-oss-process=image/resize,w_1400/format,webp)
幸好小丁的公司使用了云服务,一键扩容出n组机器,扛住了业务增长
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_df5b53cb877147af9f136de9868259eb.png?x-oss-process=image/resize,w_1400/format,webp)
不过麻烦事来了,以前通过ssh+grep 方式查日志,愉快地抓bug的日志一去不复返了
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_485c81fe71ec436b807977d521bfa3cb.png?x-oss-process=image/resize,w_1400/format,webp)
这时候,小丁的领导来了,告诉小丁,可以考虑使用开源的ELK方案,找几台机器把日志采集上来,可以轻松管理服务器上的日志,做查询和可视化
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_38b5e0ba6335437fb92f741c666c4c6e.png?x-oss-process=image/resize,w_1400/format,webp)
果然,小丁使用了ELK方案后,轻松化解了日志难题,查问题找Bug又变得驾轻就熟
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_21478321730e47968042be457f2395ae.png?x-oss-process=image/resize,w_1400/format,webp)
随着运营推广,用户规模开始指数级增长,机器又要扩容了
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_9231e6440d374130ad25dd1f2b3a1201.png?x-oss-process=image/resize,w_1400/format,webp)
没问题,有云计算一键扩容在,轻松搞定
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_94c95c0031f1473fb5864474ade4821b.png?x-oss-process=image/resize,w_1400/format,webp)
不过,很快用来采集日志的ELK出现了瓶颈。原来Elasticsearch虽然查得快,奈何写入慢呀。经过各种调优也没有得到很好缓解。
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_cde648af2fea4bb2b5effdb833332834.png?x-oss-process=image/resize,w_1400/format,webp)
于是,小丁找领导请教。原来有一个叫Kafka的开源软件,可以解决这个问题
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_f460cdb816f94f619d5e3d3a7889955b.png?x-oss-process=image/resize,w_1400/format,webp)
有了Kafka在ElasticSearch前做缓冲,终于可以缓解ElasticSearch的写入压力,虽然有时候从采集到ElasticSearch查询可以见,有一段时间延迟,总体来说还在接受范围
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_b9de33b9ef1d4f6d8572dc01f3ca66fe.png?x-oss-process=image/resize,w_1400/format,webp)
过了好长一段愉快的程序员时光,忽然有一天财务找到小丁,说要核算机器成本。一看吓一跳,原来自建的Kafka和ElasticSearch竟然占了这么多机器。原来,这些机器规模都是按照日志高峰时期设定的规模,低峰时这些机器的利用率非常低。这是有点浪费呀
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_12ea4ab9d67d4493ab3b1b0a25bccf7d.png?x-oss-process=image/resize,w_1400/format,webp)
小丁带着疑惑,又跑去请教领导。领导这次也有新发现:阿里云的SLS服务提供了完全Serverless的日志托管功能,也就意味着不用购买机器就可以使用SLS了。
并且它提供了一站式的日志查询、分析、可视化、告警、AIOps、Trace等各类日志功能,真是应有尽有啊。 不仅如此,它还兼容了Kafka的写入协议,也就是意味着之前的采集配置可以换一个写入端,就可以轻松写到SLS
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_2ec49f19d1014b599357eac68c4cccb0.png?x-oss-process=image/resize,w_1400/format,webp)
”哎呦,不错呢“,小丁回到自己的电脑前,调研了起来,发现SLS确实很适合他的场景。 把自建的Kafka+ES的机器和SLS做了一个成本对比,发现SLS的方案可以省好一笔钱了。不仅如此,SLS提供的All In One的能力,就再也不用为各种调优和运维的问题烦恼了。 这就用起来
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_8590db33bb5348458dad07e59eb1d98e.png?x-oss-process=image/resize,w_1400/format,webp)
从此,小丁过上了幸福的程序员生活~
附:
阿里云SLS服务介绍 https://help.aliyun.com/product/28958.html
联系阿里云SLS
![](https://ucc.alicdn.com/vwkxira3742tm_20240422_491b81f2a4404450a8ceaf1474135209.png?x-oss-process=image/resize,w_1400/format,webp)