做好“商户服务摆渡人”,收钱吧构建统一运维管理平台

本文涉及的产品
对象存储 OSS,20GB 3个月
日志服务 SLS,月写入数据量 50GB 1个月
文件存储 NAS,50GB 3个月
简介: 用了SLS后,对运维团队来说,整合了各种运维监控系统,从原来的被动运维转为主动运维,大大提高了运维效率,严重故障发生次数从原来的每月1次降到每季度不到一次,用户满意度稳步提高,页面响应时间从原来的4-5秒降到1-2秒,用户体验有了质的提升。

一、客户简介


收钱吧成立于2013年,现已成为国内领先的数字化门店综合服务商。收钱吧通过网络和数据的力量,为商家提供专业的移动支付收款、营销管理软件、广告、供应链、共享充电宝、商家社区等多种服务,全方位解决线下商家的开店需求。

 收钱吧logo.jpg

目前,收钱吧服务网络已经覆盖中国境内所有城市(含香港),累计服务人次近300亿,为线下近500万实体商家提供服务。从夫妻店到国际连锁品牌,收钱吧的身影遍布大江南北,深入大街小巷。

 

二、客户需求


1. 用户体验


收付款业务对性能和用户体验要求很高,扫描门店码后的页面性能、支付性能、客户端的稳定性等每个环节都需要秒级响应,以确保用户整体支付体验的完整。

 

2. 统一运维平台


另外运维团队需要一个统一的运维管理平台,给各业务模块提供平台化的服务。由于收钱吧业务涉及收款、广告、供应链、共享充电宝等多种类型,运维团队需要集中管理所有业务的基础架构和系统的稳定运行,出现问题后,可以让各业务团队在不登录服务器的情况下自助排查问题,查找故障日志,所以需要一个可以给不同业务团队分别设置权限的日志管理平台。

 

3. 广告投放效果数据采集和分析


广告效果的好坏一直是各广告主关注的核心要素,广告的触达人数、用户点击率、转化率等是衡量广告投放渠道最关键的指标。这些来自世界各地实时数据的统一采集、清洗和低成本分析对大数据团队来说是个难题。

 

三、方案特点


1. 基于阿里云日志服务的实时数据采集、可视化和告警能力,运维团队制作了门店码性能监控大盘、交易品质大盘、门店码打点监控大盘等多个监控仪表盘,并对门店码异常设置了告警,及时发现并处理支付系统出现的各类故障,避免保障用户体验。

监控仪表盘1.jpg

监控仪表盘2.jpg

监控仪表盘3.png

2. 将所有服务器上的日志都接入SLS后,不同业务部门的研发人员无需登陆服务器就可以使用SLS快速查找日志,排查故障。登陆服务器上查看日志费事费力不说,还出现过误操作导致文件被删除,影响到业务的情况发生。现在使用SLS既满足安全需求,又提高了故障排查效率,现在SLS每天查询次数超过万次,深受业务方好评。

 

3. 各终端上的广告显示数量、用户点击数量等指标都通过sdk埋点方式采集上来,然后进行统一的加工和清洗,投递到ODPS中进行大数据离线分析。这套方案的优势在于首先统一了采集的方式,统一管理所有埋点数据采集方案,并且可以方便的对数据进行清洗和加工,满足广告投放效果分析的各种分析维度和组合对数据格式和质量的要求。

采样数据.jpg

四、客户价值


客户表示,用了SLS后,对运维团队来说,整合了各种运维监控系统,从原来的被动运维转为主动运维,大大提高了运维效率,严重故障发生次数从原来的每月1次降到每季度不到一次,用户满意度稳步提高,页面响应时间从原来的4-5秒降到1-2秒,用户体验有了质的提升。

 

同时日志服务也在各业务部门和大数据团队中有了很好的口碑,很好的支持了收钱吧各业务团队的工作,获得了很好的口碑。

相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
运维 监控 Docker
构建高效微服务架构:从理论到实践构建高效自动化运维体系:Ansible与Docker的完美融合
【5月更文挑战第31天】 在当今软件开发的世界中,微服务架构已经成为了实现可伸缩、灵活且容错的系统的关键策略。本文将深入探讨如何从零开始构建一个高效的微服务系统,涵盖从概念理解、设计原则到具体实施步骤。我们将重点讨论微服务设计的最佳实践、常用的技术栈选择、以及如何克服常见的挑战,包括服务划分、数据一致性、服务发现和网络通信等。通过实际案例分析,本文旨在为开发者提供一套实用的指南,帮助他们构建出既健壮又易于维护的微服务系统。
|
1天前
|
运维 监控 Devops
DevOps实践:构建高效运维流程
【6月更文挑战第29天】在现代软件开发周期中,DevOps已成为推动开发和运维团队紧密合作的重要哲学。本文将探讨如何通过DevOps实践来构建一个更高效的运维流程,从而提升软件交付速度、提高产品质量,并确保系统的稳定性和安全性。我们将从持续集成、自动化测试、配置管理、容器化部署、监控与告警等关键方面入手,深入分析DevOps实施过程中的关键环节及其对运维工作的影响。
10 3
|
9天前
|
JSON 弹性计算 运维
深入浅出资源编排ROS:构建云环境下的自动化运维利器引言
**资源编排ROS是阿里云提供的自动化管理工具,通过声明式模板定义云资源生命周期,简化复杂IT架构的运维。它解析JSON或YAML模板,自动创建、更新资源,确保状态与模板一致。ROS用于环境一致性、故障恢复、成本优化,是现代云管理的关键,助力企业提升效率和成本效益。**
80 3
|
25天前
|
开发框架 运维 前端开发
构建一体化运维平台的八大功能
【6月更文挑战第6天】构建一体化运维平台的关键8个基本功能。
|
24天前
|
设计模式 运维 监控
运维一体化平台的能力要素
【6月更文挑战第7天】一体化运维平台的重要性,旨在建立覆盖运维全生命周期的统一平台,提升效率,保障业务连续性,实现数字化运维管理。
|
2月前
|
运维 监控 Devops
构建高效自动化运维系统:DevOps在企业级应用的实践
【5月更文挑战第30天】 随着信息技术的飞速发展,企业对软件交付速度和稳定性的要求越来越高。传统的运维模式已无法满足快速迭代和高效稳定的需求,因此,本文将探讨如何通过实施DevOps文化、流程和工具,构建一个高效的自动化运维系统。文章将详细描述DevOps的核心理念、关键技术组件以及如何在组织中落地实施策略,旨在帮助企业提升运维效率,加速产品的上市时间,同时保证系统的高可用性和稳定性。
|
2月前
|
运维 Prometheus 监控
构建高效可靠的自动化运维系统
【5月更文挑战第30天】 在信息技术迅猛发展的今天,企业对IT基础设施的依赖性日益增强。为了确保系统的高可用性和最佳性能,越来越多的组织开始转向自动化运维。本文旨在探讨构建一个高效、可靠的自动化运维系统的关键技术和实践策略,通过案例分析和技术比较,提出一种综合解决方案,以期帮助企业实现运维效率的最大化和风险的最小化。
|
2月前
|
运维 Devops 测试技术
构建高效自动化运维体系:基于Ansible的实践指南
【5月更文挑战第30天】 在当今IT基础设施管理领域,自动化已成为提高效率、确保一致性和减少人为错误的关键。本文将探讨如何利用Ansible这一强大的自动化工具来构建一个高效的运维自动化体系。文章不仅介绍了Ansible的基本原理和组件,还通过实际案例展示了如何集成Ansible到现有的运维流程中,以及如何处理常见的自动化挑战。读者将获得一套实用的策略和最佳实践,以优化其自动化运维工作。
|
2月前
|
运维 Kubernetes 持续交付
构建高效自动化运维体系:基于容器技术的持续集成与持续部署实践
【5月更文挑战第30天】随着云计算和微服务架构的兴起,传统的运维模式已难以满足快速迭代和高可用性的需求。本文探讨了如何利用容器技术构建一个高效、可靠的自动化运维体系,重点分析了Docker和Kubernetes在这一过程中的关键作用,并提出了一套基于这些技术的持续集成(CI)与持续部署(CD)解决方案。通过实际案例和操作步骤的详细阐述,文章为读者提供了一种实现自动化运维的有效途径,同时对未来运维技术的发展趋势进行了展望。
|
2月前
|
运维 Kubernetes 持续交付
构建高效自动化运维体系:基于Docker和Kubernetes的实践
【5月更文挑战第30天】 在当今的快速迭代和持续部署的软件发布环境中,自动化运维的重要性愈发凸显。本文旨在探讨如何利用容器化技术与微服务架构,特别是Docker和Kubernetes,来构建一个高效、可伸缩且自愈的自动化运维体系。通过详细分析容器化的优势及Kubernetes的集群管理机制,文章将提供一个清晰的指南,帮助读者理解并实现现代软件部署的最佳实践。