看畅捷通如何利用阿里云快速定位异常,降低运维成本

本文涉及的产品
对象存储 OSS,20GB 3个月
对象存储 OSS,恶意文件检测 1000次 1年
对象存储 OSS,内容安全 1000次 1年
简介: 阿里云通过日志服务综合解决方案,帮助畅捷通运维开发团队解决了误报频繁、无法快速发现问题站点、无法快速定位异常的问题,实现了运维效率、运维成本、沟通成本等方面的改善。支撑了畅捷通所有云产品的健康稳定运行,在IT运维开发领域树立了一个标杆。

更多存储标杆案例
欢迎点击下方链接查看

阿里云存储标杆案例样板间

公司介绍
畅捷通是用友旗下成员企业,为400多万小微企业提供智能云管理服务,公司于2010年3月成立,并与2014年6月在香港联交所主板挂牌上市。

畅捷通以“用创想与技术,推动小微企业经营与管理进步「为使命,以成为“全球领先的小微企业云服务、软件提供商」、「伙伴、员工快乐工作,成就事业,分享成功的平台」为愿景,致力于为中国小微企业提供以财务及管理服务为核心的:平台服务、应用服务、数据增值服务。

目前公司主营云产品包括畅捷通好会计、T+Cloud、畅捷通好生意、畅捷通易代账等,主营软件产品包括T系列软件。2019年度云服务企业注册用户数达到466万,累计付费企业用户数达到15.7万。软件业务累计企业用户数超过161万。

image.png

业务场景介绍
畅捷通IT运维开发部负责畅捷通包括好会计、好生意、易代账等所有云产品生产及测试系统的运维、上线发布等工作。该部门构建了一套MIDAS智能运维平台,提供了数据接入,数据处理和场景化分析的能力。

畅捷通智能运维平台的业务模型:

image.png

面临的痛点
畅捷通在智能运维平台开发初期,底层使用了自建的ELK进行运维数据分析,但是随着畅捷通业务的增长接入的应用系统增多,很快发现平台出现各种问题,各产品的稳定运行收到极大挑战,主要表现为如下几方面:

并发量大,优化ELK成本过高
几万个点同时并发发送数据,每天产生的各种日志与消息达到TB级。自建的ELK系统性能较差,优化性能需要耗费大量开发资源。类型杂,数据清洗难度大,访问类、系统类、应用类、通知、消息类等等,种类繁多、格式千奇百怪,为数据清洗增加了巨大的难度。

来源多,无法集中管理

网络、服务器、移动app、web、docker等各种来源的日志,接口繁多,并且要求实时性高,无法集中统一管理。

产品部门深度参与,重口难调
各产品部门也会对对收集来的数据都有着自己个性化的需求,监控报警、问题诊断、分析挖掘、报表等,消费模式也多种多样。

image.png

阿里云日志服务解决方案
畅捷通面对这些问题,选择使用阿里云日志服务作为基础来深度打造其智能运维平台,整个平台由如下三大模块构成:

高效消息采集和传输
利用阿里云日志服务的强大的数据接入能力,将畅捷通混合云架构中网络、服务器、移动端、容器的各类访问类、系统类、应用类、消息类等各类日志统一汇入日志平台,提供实现每日TB级数据的快速处理。

灵活的数据处理和存储
针对畅捷通内部已经具备完善CMDB和关联规则的情况,将原始日志进行语意切分和序列化后,对应到场景分析中。在策略组里找到相应的执行策略,再发到外部服务中,用外部服务去调用ansible或者消息转发等操作,实现对数据投递的集中管理,为后续众多场景化分析提供有力支撑。

智能异常检测和定位
过日志服务的时序数据分析与函数计算的能力,畅捷通构建了智能运维平台,通过直接使用阿里云服务的同环比函数,可以快速的得出监控指标的当前值,并且具有实时性。有了同环比后,报警的发送会变得准确,与原来的阈值相比准确性大大提高。
通过异常预测函数,可以从海量指标中快速定位异常,通过异常检测方法将有问题的地方显示出来,快速发现系统故障。
另外将各块汇集过来的数据进行标记后,能够与应用的配置信息进行关联和整合,通过时序可以发现故障的根因,从而可以实现故障预测。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
相关文章
|
2月前
|
机器人
阿里云 RPA 的成本效益分析
机器人流程自动化(RPA)技术在企业数字化转型中扮演着越来越重要的角色。阿里云 RPA 作为一种高效的自动化解决方案,不仅可以提高业务效率,还可以降低运营成本。本文将对阿里云 RPA 的成本效益进行分析,帮助企业更好地评估和利用这一技术。
|
3月前
|
人工智能 机器人 Serverless
魔搭大模型一键部署到阿里云函数计算,GPU 闲置计费功能可大幅降低开销
魔搭大模型一键部署到阿里云函数计算,GPU 闲置计费功能可大幅降低开销
582 2
|
3月前
|
弹性计算 运维 监控
基于钉钉的阿里云管理实践(三)之运维管控
随着移动互联网的发展,使用移动设备进行云资源管理变得越来越普及。钉钉作为一款企业沟通和协作工具,其集成的阿里云控制台小程序让用户能够在移动端进行便捷的云资源管理操作。本教程将为您介绍如何在钉钉的阿里云控制台小程序内访问并操作阿里云资源。
115 1
|
17天前
|
弹性计算 前端开发 Java
使用阿里云 mqtt serverless 版本超低成本快速实现 webscoket 长链接服务器
使用阿里云 MQTT Serverless 可轻松实现弹性伸缩的 WebSocket 服务,每日成本低至几元。适用于小程序消息推送的 MQTT P2P 模式。前端需注意安全,避免 AK 泄露,采用一机一密方案。后端通过调用 `RegisterDeviceCredential` API 发送消息。示例代码包括 JavaScript 前端连接和 Java 后端发送。
166 0
|
2月前
|
弹性计算 数据安全/隐私保护
【零成本】【懒人版】阿里云上雾锁王国/Enshrouded服务搭建教程
【零成本】【懒人版】雾锁王国/Enshrouded服务搭建教程。随着游戏行业的不断发展,玩家们对于游戏体验的要求也越来越高。为了满足玩家们的需求,腾讯云提供了游戏联机服务器一键部署方案,本文将为大家分享基于阿里云服务器10秒钟完成雾锁王国游戏服务器搭建教程,让大家的游戏体验更加顺畅。
|
2月前
|
弹性计算 Linux 数据安全/隐私保护
阿里云4核16G服务器搭建幻兽帕鲁成本仅需26元
阿里云4核16G服务器搭建幻兽帕鲁成本仅需26元,幻兽帕鲁Palworld多人游戏专用服务器一键部署教程,阿里云推出新手0基础一键部署幻兽帕鲁服务器教程,傻瓜式一键部署,3分钟即可成功创建一台Palworld专属服务器,成本仅需26元,阿里云百科分享2024年新版基于阿里云搭建幻兽帕鲁服务器教程
|
2月前
|
弹性计算 安全 Linux
成本26元一键部署阿里云幻兽帕鲁联机服务器,阿里云出品
成本26元一键部署阿里云幻兽帕鲁联机服务器,阿里云出品,如何自建幻兽帕鲁服务器?基于阿里云服务器搭建幻兽帕鲁palworld服务器教程来了,一看就懂系列。本文是利用OOS中幻兽帕鲁扩展程序来一键部署幻兽帕鲁服务器,阿里云百科分享官方基于阿里云服务器快速创建幻兽帕鲁服务器教程:
97 0
|
3月前
|
存储 人工智能 Kubernetes
阿里云ACK助力GPU成本优化,实现灵活管理
摘要:本文将介绍如何在阿里云容器服务ACK中,利用cGPU技术,共享GPU算力,提高GPU利用率,降低TCO。
58 2
|
3月前
|
SQL 监控 关系型数据库
解密SQL性能异常事件及阿里云数据库的性能调优实践
作为开发者想必都知道数据库是现代应用的核心组件之一,而且在当今互联网时代之下,SQL查询的性能直接影响系统的整体性能,它的性能对于系统的稳定性和响应速度至关重要。那么本文就来讨论一下SQL性能异常的排查和优化方法,包括我个人印象深刻的SQL性能异常事件,以及分享一下使用阿里云数据库产品/工具进行SQL性能调优的经验和心得体会。
85 1
解密SQL性能异常事件及阿里云数据库的性能调优实践
|
4月前
|
存储 定位技术 对象存储
阿里云对象存储OSS外网流出流量异常增多导致费用上升的解决方法
阿里云对象存储OSS外网流出流量异常增多导致费用上升的解决方法
198 1
阿里云对象存储OSS外网流出流量异常增多导致费用上升的解决方法