数云运维总监陈延宗:基于阿里云计算巢,数云CRM一键云上交付

简介: 本文是数云上架到计算巢的方案介绍,原文请查看:https://mp.weixin.qq.com/s/LY9wa5sb7rupVtTs48tsEg12月21日,在弹性计算年度峰会上,数云CRM运维总监陈延宗发表了主题为《计算巢最佳实践--数云CRM一键云上交付》的演讲,介绍了数云CRM在阿里云计算巢平台的最佳实践。图:数云CRM运维总监陈延宗01 传统交付的四个痛点 数云目前已发展成为国内领先的全

本文是数云上架到计算巢的方案介绍,原文请查看:https://mp.weixin.qq.com/s/LY9wa5sb7rupVtTs48tsEg

12月21日,在弹性计算年度峰会上,数云CRM运维总监陈延宗发表了主题为《计算巢最佳实践--数云CRM一键云上交付》的演讲,介绍了数云CRM在阿里云计算巢平台的最佳实践。

图:数云CRM运维总监陈延宗

01

 传统交付的四个痛点 

数云目前已发展成为国内领先的全域消费者增长解决方案提供商,客户群体基本都偏向于大中型企业商家。这些商家客户中的一部分会要求做私有化部署,在其阿里云平台上部署业务系统。

在阿里云平台上,数云为企业提供了CRM交付落地时可能需要用到的组件,如上图,组件的种类非常多,包括安全、日志SLS、对象存储OSS 以及AKS等,其中的组件,特别是SLS、WAF、安全组都可能被使用到,它们都有一个特点,配置会很复杂化、业务化。

传统的交付过程中,对于一个比较大的企业级应用交付,基本流程分为四步:

◾ 第一步,商务流程。先跟客户沟通一个具体的采购和合同的商务事宜。

◾ 第二步,采买过程。第一步商定好以后,运维工程师会提交数云的资源清单给客户,资源清单会包含上面提到的组件的组合,这些资源都是要客户手动购买。如果有To B业务经验的可能会比较清楚,不同的B端客户,他们IT团队不一样,每家情况都不一样。有的IT团队就一个人,对于阿里云的熟悉度并不高。

这个过程,数云会提供一些建议,比如提供购买方法、资源型号等;可是仅仅一个ECS型号就有大几百个,客户很难选择,我们又需要点对点地沟通解释,这个过程付出了非常多的人力沟通成本,单纯的采买过程可能只要一天,但是沟通过程就需要5个工作日。

◾ 第三步,安装过程。安装过程是比较快,基本是一键部署,由人手动操作的,资源检查也是人来操作的,只要人操作就可能会出错。系统初始化工作比较艰难,例如,一个比较大型的客户,整个流程可能需要两周。

◾ 第四步,业务使用。我们把系统初始化完成以后交付到客户方,客户来做相关的使用。

在这个四个流程当中,总结起来痛点大概分四个:

◾ 检查。整个资源配置的结果是需要人肉核查,有些客户的账号不会给到,那就需要我们来盲猜,猜一下机器的安全组等等这些信息,然后需要手动去做;另外,资源的配置点比较多,资源清单种类也比较多,检查工作就比较重。

◾ 操作。整个过程都是手动来操作的,包括采买,这样就容易出现相关的错误。当阿里云平台推出一些新的资源型号,做一些改动,那文档的更新就比较麻烦,因为它不是自动化的;另外,文档的更新会出现一些延迟,可能给到客户是一个错误的文档。

◾ 沟通。沟通的成本非常大。

◾ 时间。往往这些时间一直浪费在沟通和出错成本上,理论上这些应该都是要避开的。

02

 阿里云计算巢让云上交付自动化 

接入到阿里云计算巢之后,这些过程和操作就变得比较简单了。我们需要把整个过程实例化出来,放到资源编排ROS里面来做。现在客户需要来购买软件的时候,我们会给出资源清单,客户只需要关注数量即可,比如说某个组件购买一个还是几个;客户买完以后基本上无需检查,因为他购买的资源一定是按照我们的标准来定义的,包括ECS、数据库型号及版本等。

优化过程后,大家可以看到带来了以下收益:

◾ 检查,这部分不再需要做,因为配置模板化

◾ 操作,实现了自动化,客户只需选择购买的数量。

◾ 沟通,只需要提供最基础的业务内容介绍文档就可以,不再需要细节沟通

◾ 时间,整体时间缩短,现在已经通过阿里云计算巢部署了5、6家客户,每家的时间不超过一天,包括沟通、采买到最后初始化完成交付的时间。

03

 未来规划与升级 

阿里云计算巢发布到现在有大概半年时间,我们真正对接也是近几个月开始的。未来,我们会将一些自动化的程序加到里面去,做到更智能、更自动,具体分为3个方面:

1、租户关系开通。租户开通的时候,都会通过阿里云计算巢的开通关系跟租户系统中的开通租户沟通;也会包括增值账户的开通,企业类的租户可能有一些预充值的费用,这一块主要为数云内部的系统流程。

2、主机应用层初始化的优化。我们需要监控所有客户主机的运行情况,比如日志的SLS、Metrics以及一些基础的运行数据,或者一些特别指标(如tracing数据);同时包括K8s集群的初始化优化;我们将会把这些内容整合到计算巢中,实现可选的自动化插件。

3、完善保障体系。To  B业务有一个难点就是多环境、多租户的维护问题,我们的口号概括为三个数字“1、5、10”,就是1分钟发现问题、5分钟定位问题、10分钟解决问题。主要是使用自动化的工具,缩短可以来促进“1、5、10”目标达成的相关过程。

04

 计算巢上的交付演示 

上图主要展示了我们资源清单的样例。左边就是管理的节点,右边是后端模块使用的具体节点,比如说ECS、PolarDB、DTS、Redis等,这些我们都会用到。这里展示的每一个节点的购买可能都需要非常复杂的文档,客户在采买的时候,可能会问非常多的问题。

 

视频:基于计算巢的CRM资源采买过程

这个视频展示的是我们采买的过程。客户对采买的数量、实例的类型、系统的版本、交换机数量、购买时间等基础信息进行选择,从而完成部署。

 

根据视频demo演示,可以看到整个过程基本没有手动操作,运维人员可以看到相关的资源信息;如果客户已经通过数云购买了资源,我们可以通过阿里云计算巢看到后台的资源状态,甚至一些系统级别的事件可以直接看到,这点对于我们运维来说也是非常友好的。

相关实践学习
2048小游戏
基于计算巢&ECS云服务器快速部署,带您畅玩2048小游戏。
目录
相关文章
|
4月前
|
运维 安全 数据安全/隐私保护
|
3月前
|
运维 监控
如何使用OOS有效进行云上自动化运维
OOS(运维编排服务)是一种云上自动化运维工具,可以帮助你有效进行云资源的管理和维护。以下是如何使用OOS有效进行云上自动化运维的一些建议: 1. **利用自动化能力**:OOS提供了批量操作、
|
2月前
|
运维 监控 安全
云上智能监控:引领未来安防与运维的新纪元
通过智能视频分析技术自动识别违章行为(如闯红灯、超速等)并触发报警机制。同时结合交通流量监测和信号灯控制功能实现交通流量的优化和拥堵缓解。 智能零售监控:在零售行业中云上智能监控可以应用于店铺的客流统计和商品管理。
|
2月前
|
人工智能 运维 自然语言处理
|
2月前
|
运维 监控 Serverless
探索Serverless高可用架构:云上极简运维的新篇章
随着云计算的快速发展,Serverless 架构因其无需管理服务器、按需自动扩展等优势,逐渐成为企业应用构建的重要选择。阿里云提供的 Serverless 高可用架构解决方案,通过结合多种云服务,提供了强大的高可用性和自动化运维能力。本文将评测阿里云 Serverless 高可用架构的核心功能、优势及其应用场景,帮助读者更好地理解和使用这一解决方案。
|
2月前
|
运维 监控 安全
云上智能运维:重塑IT运维的未来图景
深度学习等技术实现更加精准的故障预测和性能优化。同时,随着云计算技术的不断成熟和普及,云上智能运维将实现更加灵活、高效的资源管理和服务交付。此外,随着安全技术的不断发展和完善,云上智能运维将更加注重数据安全和隐私保护,为企业提供更加安全可靠的运维服务。
|
2月前
|
弹性计算 人工智能 安全
|
4月前
|
弹性计算 人工智能 安全
蚂蚁数科MAPPIC密态计算云平台入驻阿里云计算巢,打造云上密态计算服务
阿里云计算巢新添成员——蚂蚁数科的MAPPIC密态计算云平台,旨在为企业提供安全的大数据和模型密态计算服务,促进数据资产和模型资产的挖掘。MAPPIC是融合AI和BI的隐私保护平台,支持N+接入方式和弹性计算。通过阿里云计算巢,企业能快速创建密态计算集群,降低使用门槛,同时提升业务可靠性和审计追溯能力。双方合作将加速密态计算在云上的应用,应对数据隐私和安全挑战。
蚂蚁数科MAPPIC密态计算云平台入驻阿里云计算巢,打造云上密态计算服务
|
2月前
|
运维 Prometheus 监控
「架构」云上自动化运维及其应用
企业在云上采用自动化运维,通过Prometheus+Grafana实现监控,Ansible进行配置管理,Jenkins+GitLab+SonarQube支持CI/CD,提升效率,降低成本。关键指标包括系统可用性、故障恢复时间等。通过自动化监控、配置管理和持续集成/部署,保证服务稳定性,促进快速迭代,确保市场竞争力。持续改进与培训是维持领先的关键。
44 0
|
4月前
|
弹性计算 运维 安全
如何使用OOS有效进行云上自动化运维
阿里云弹性计算团队十三位产品专家和技术专家共同分享云上运维深度实践,详细阐述如何利用CloudOps工具实现运维提效、弹性降本。
134106 220

相关产品

  • 计算巢服务