云场景实践研究第2期:高德

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS MySQL,高可用系列 2核4GB
简介: 作为国内最早一批提供地图API互联网服务商的高德,通过拥抱云计算,最终实现了应用服务可用性上升到99.99%,同比提升了5倍,并且大大降低了企业运维的人力资源成本。本文将站在运维的角度,为大家分析高德如何借助阿里云的力量实现运维自动化。

更多云场景实践研究案例,点击这里:【云场景实践研究合集】联合不是简单的加法,而是无限的生态,谁会是下一个独角兽

作为国内最早一批提供地图API互联网服务商的高德,通过拥抱云计算,最终实现了应用服务可用性上升到99.99%,同比提升了5倍,并且大大降低了企业运维的人力资源成本。本文将站在运维的角度,为大家分析高德如何借助阿里云的力量实现运维自动化。

“企业应当及时抓住云计算技术带来的新机遇,针对自身不足,实施相应的技术和业务变革,拥抱云计算,充分发挥云计算技术在企业管理中的作用,从而增强企业的竞争能力。”

——曾伟

高德高级运维专家

高德于2002年成立,这十几年的发展使得高德产品从简单的车载导航产品应用至整个互联网,如今强大的产品或服务经历了一个漫长的IT信息化成长过程,从运维角度的来说,经历了从没有运维团队的浑沌阶段,到开始建立运维团队,专业化运作,再到借助阿里云的力量实现自动化运维的阶段。


采用的阿里云产品
  • 阿里云云服务器 ECS
  • 阿里云负载均衡 SLB
  • 阿里云对象存储 OSS
  • 阿里云云数据库 MySQL 版
  • 阿里云云数据库 Redis 版
  • 阿里云大数据计算服务 MaxCompute
  • 阿里云数据传输服务 DTS
  • 阿里云内容分发网络 CDN
  • 阿里云流计算 Stream Computing

为什么使用阿里云

业务的快速增长下,自建小机房运维模式的痛苦,需要实现自动化运维

需要借助阿里云的弹性伸缩服务,实现基础设施的快速扩展

需要保证大型活动系统的高可靠性


关于 高德

高德是国内领先的数字地图内容、导航和位置服务解决方案提供商。自2002年起步以来,经过十二年的不懈努力和艰辛探索,积累了扎实的技术,构筑了地图行业高壁垒,公司在各项业务取得重大发展的同时成为行业翘楚。2010年,高德提出了向移动互联网转型的战略,依托在汽车导航市场取得的领先地位,在产品、服务和商务模式上继续不断创新,迅速构建起支撑各类产品和服务海量用户的“地图云服务”平台,努力实现基于“四屏一云”业务构架的“移动生活位置服务门户”战略。


高德所面临的挑战——运维之痛

在上云前,高德在运维方面经历了很多的痛苦,比如自建机房带来的运维之痛,高德之前有7个小机房零散分布在全国各个地方,但随着业务的快速增长自建小机房模式带来很多问题,包括IDC电力、空调、网络都很容易故障,也使得当时需要大量运维人员;同时也面临大量的运维需求,因为运维需要负责IDC、电力、网络、服务器、OS、数据库(MySQL、Redis、Oracle、Memcache、PG、MongoDB)、各种应用软件(Nginx、Apache)、开源工具(Jenkins、Puppet),大量的需求使得运维人员的经历分散,产生非常大的压力。另外,有时候因用户激增带来的大流量,加上原本吃紧的带宽等问题,甚至会造成重大活动/节日时的宕机。


为什么选择阿里云?

高德上云之路

高德在运维方面经历的痛和负重在上云后都得到了根本性的改变,首先基于阿里云实现了统一基础设施的运维,让运维人员不再运维基础设施;同时,阿里云提供的各种云服务有负载均衡弹性计算ECS云数据库RDS对象存储OSS云数据库Redis版大数据计算服务MaxCompute等,运维人员只需要使用好这些服务就可以了,不需要去维护具体的组件。另外,高德经常有大型活动,用户访问量会在某个阶段激增,这时就需基于阿里云的弹性伸缩服务,就能实现快速扩展的基础设施。最后,运维人员只需要专注于业务的性能、架构、故障等核心价值即可。

但是,高德在刚开始上云时,对于熟悉传统数据中心的运维人员有可能不熟悉各种云服务组件,以及高德IDC和阿里云并网运行期间,日志实时传输延迟导致实时数据分析会出现延迟的情况。而通过阿里云提供的完善技术、及时的响应、培训支持,快速地解决了遇到的问题,最终运维人员可以很熟练的使用云服务。比如,在高德MySQL数据库转阿里云RDS的过程中,遇到了数据迁云的问题——数据格式、写的方式、导出/导入方式,最后利用阿里云强大的RDS直接通过中转区搭建了DTS系统,实现了跨网数据库迁移的无缝切换和数据一致性。另外,高德也用到了阿里自研的DRC产品(Data Replication Center),支持异构数据库实时同步,数据记录变更订阅服务,为跨域实时同步、实时增量分发、异地双活、分布式数据库等场景提供解决方案。

3566e2d7c57583e63dcbd505dfa8b022faf7e91f

高德基于阿里云的最佳运维实践


拥抱阿里云所带来的成效

在迁到阿里云上之后,高德地图的应用服务可用性上升到99.99%,比之前的7个小机房提供的服务可用性提升了5倍。另外,从以前的每次大型活动系统常崩溃,到国庆出行高峰的运维人员淡定、系统稳若磐石,充分体现了阿里云计算的稳定性。再者,以前高德的新应用上线和扩容,至少得提前2个月开始采购服务器、上架、装机、人肉扩容、发布,上阿里云之后,弹性扩缩容基本上在20分钟内就完成,新应用上线10到20分钟内就可以完成资源申请到应用发布上线


如今,高德所有核心业务系统已经全部放在云上,由阿里云提供计算服务。在具体的运维人员事情方面,使用阿里云的服务即可;异地容灾只需要申请不同地域的云服务,不需要自己去建设机房。安全面方面,阿里云提供了很多服务,比如防攻击(DDos)、流量清洗、防病毒、防欺诈、代码扫描等;此外,总结阿里云为高德提供的服务,大概有这几方面,首先是IaaS (Infrastructure-as-a-Service,基础设施即服务):包含多地机房,网络,巡检等;其次是PaaS(Platform-as-a-Service,平台即服务):高德使用到的云产品包含弹性计算ECS云数据库RDS对象存储OSS负载均衡SLB内容分发网络(CDN)大数据计算服务MaxCompute等;最后是SaaS(Software-as-a-Service,软件即服务):高德自身的系统提供的服务。

整体来说,对于高德运维变化最大的就是运维模式的变化,从原来的IDC到网络到数据库等基础服务都要自己维护,变化为使用阿里云的各种云服务,运维人员可以专注于架构、故障、性能等核心能力上,员工的成就感得到了很大的提升,同时运维的人力成本。也就是说,全面云化后,是运维核心价值的转变和变革。高德除了常规导航服务,在上云后,利用阿里云“数加”平台强大的计算处理能力,比如阿里云的大数据计算服务MaxCompute流计算Stream Computing等服务,高德可以做出行线路选择、拥堵大数据、躲避拥堵、城市热点分布、景区推荐、商圈热度,主要是根据用户的定位数据,进行实时的数据挖掘,从而跑出预测模型,实时得到现对用户有用的结果。


关于高德的更多实践详情:高德运维基于阿里云的最佳实践

原文发布日期:2016-1-26

云栖社区场景研究小组成员:贾子甲,仲浩。

相关实践学习
Serverless极速搭建Hexo博客
本场景介绍如何使用阿里云函数计算服务命令行工具快速搭建一个Hexo博客。
相关文章
|
人工智能 Go 开发者
NPCon2023 AI模型技术与应用峰会(北京站)--------全链路搭建AI研发底座 参会感受
NPCon2023 AI模型技术与应用峰会(北京站)--------全链路搭建AI研发底座 参会感受
330 0
|
Prometheus 运维 监控
|
人工智能 智能设计 城市大脑
2021云栖大会【视觉AI平台与生态论坛】线上直播等你来~
2021云栖大会【视觉AI平台与生态论坛】将于10月22日在杭州云栖小镇开启,可能因为地域的原因,您未能亲临现场,本次大会将在线上同步直播,大家不用出门,在家就能看到最新科技领域的成果展示~
789 0
2021云栖大会【视觉AI平台与生态论坛】线上直播等你来~
|
人工智能 自然语言处理 算法
平台建设的7大问题:蚂蚁AI平台实践深度总结
在支持蚂蚁几乎所有核心业务运行和发展的过程中,我们在平台建设、业务支持、平台运营、AI创新以及AI整体运营等各个方面做了很多尝试,有了不少的收获和感悟,在此分享给大家。
平台建设的7大问题:蚂蚁AI平台实践深度总结
|
弹性计算 城市大脑 小程序
不穷:阿里企业大脑最佳实践
一个好产品的产生,就是由数字化的能力加上一个好的治理思想,进行碰撞,进行结合,才会创新出数字化转型成果。阿里巴巴副总裁、企业智能/政企云/数字政务中台事业部负责人叶军为您带来阿里巴巴企业大脑战略和智能实现的最佳实践。
不穷:阿里企业大脑最佳实践
【1520技术开放日·宁波站】智能应用方案及技术对接动手实验室专场
平头哥1520技术开放日第六场来啦!本期开放日我们将在11月6日来到宁波,带着最新的无线控制技术跟应用方案跟深圳的小伙伴进行闭门交流。 开放日亮点: ①有机会承接阿里巴巴平头哥芯片内部项目 ;②有机会获取1520技术大礼包;③有机会成为平头哥大湾区深度合作伙伴
289 0
【1520技术开放日·宁波站】智能应用方案及技术对接动手实验室专场
|
机器学习/深度学习 人工智能 算法
5G时代下端侧AI势必大火!阿里技术专家在线解读
人工智能发展已进入“落地为王”阶段,端侧 AI 相比云侧 AI,具有低延时、保护数据隐私、节省云端计算资源等优势,现已成为端侧技术新热点,并且紧贴用户在 AR 特效、搜索推荐等方面有诸多创新应用。近日,阿里巴巴淘系技术部资深无线开发专家吕承飞(吕行)受 InfoQ 邀约,为大家介绍端侧 AI 的现状以及在阿里的实践。本文将回顾端侧 AI 的发展过程,以阿里端侧 AI 发展为例展望端侧 AI 的未来。
1690 0
5G时代下端侧AI势必大火!阿里技术专家在线解读
|
Prometheus 监控 安全
云时代如何实现企业IT智能诊断?|对话阿里云MVP蒋烁淼(下)
与湖畔大学首期学员、阿里云MVP、驻云创始人蒋烁淼面对面
2008 0
|
人工智能 大数据
阿里云李静远:阿里云大数据计算平台和ET大脑群的科研工程实践
2018年11月17-18日,第十七次中国物流协会学术年会在江西南昌滨江宾馆举行,中国物流与采购联合会会长何黎明、江西省高安市委书记袁和庚、高校著名学者和同学们、阿里云、海尔集团等企业代表受邀出席,千余名中国物流行业的从业者注册并聆听大会。
2643 0