ApsaraDB云数据库助力优驾产品升级和架构变革

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: 2017云栖大会POLARDB专场,广州通易科技有限公司技术负责人刘锬带来ApsaraDB云数据库助力优驾产品升级和架构变革的演讲。本文主要先介绍了优驾产品,接着介绍了应用需求与技术架构,最后分享了上云之路和使用云数据库的体会。

2017云栖大会POLARDB专场,广州通易科技有限公司技术负责人刘锬带来ApsaraDB云数据库助力优驾产品升级和架构变革的演讲。本文主要先介绍了优驾产品,接着介绍了应用需求与技术架构,最后分享了上云之路和使用云数据库的体会。

以下是精彩内容分享:

 

优驾产品

dd6024cd7c4ac611d7edc961e14e236ac72c82d4

我们做的产品是车联网的产品,最右边是连接汽车API的盒子,我们做APP连接盒子。我们出了一个旗舰产品,4G后视镜和车的连接大屏,产品本质上来讲就是AI助理,帮助大家解决一些用车的小问题,怎么开车出行,怎么精明养车等。

我们的产品深度支持100多个车品牌,我们能读出来的数据能力和专业4S店诊断仪诊断出来的数据一样。

 

应用需求与技术架构

8a4dc6d5bcd800ee036d9ac2cd922cc83fb2c407

这是数据的架构,车里传感器非常多,很多数据流都在汽车总线上跑。而车对外暴露一个API 16桢接口,把车和网络连接起来。盒子不管是和手机、平板、后视镜、车机,都是通过蓝牙连接,数据上传到云分析数据。

汽车里的数据流比我们想象当中要多,仪表上可见的都是数据流,仪表上不可见的也有各种各样数据流,还包括在车上能看到各种各样故障灯。假设有100个数据流,每个数据流都是在50毫秒产生一个数字的变化,这个时候数据量是很大的,比如在国庆期间,有一位用户大概15天的时间从广西南宁出发,然后把青藏线和川藏线全部走了一遍,跑了8千多公里,他把8千多公里数据在一个时间点提交传上来,他的数据一天行车1200公里,1200公里数据大概有50万条原始数据,还不是我们处理后的数据,这意味着8千公里大概就是350万条左右,一次性一个峰值一个用户就把数据提交上来,我们就很痛苦自己多出一个BUG,导致不正常。

a5a351e2a6d43f6cd701c5a40976bf7674002b13

现在数据库存储成本高,我们并没有把所有数据都存到数据库。大家知道一个应用只有10万个用户,其实是非常小的应用,但它的数据量很高。我们想要做的事情是在车出现异常之前发现它,发现它之后找到解决方案,我作为一个车主能不能去之前就知道车可能会怎么修,哪一个部件坏了,甚至于部件在网上哪个卖家卖得最便宜,这是我们想要解决的问题。

我们通过大数据预测车况异常,数据接进来之后用一些机器学习算法,包括专家的知识库做一个问题预测。然后能够把维修方案给出来,跟哪个部件有关,然后再去做维修配件电商全网比价,把所有电商上汽车配件全部抓下来,看它的价格比较,告诉你去哪一家买是最便宜的。这个应用的范围很广。

 

与云共舞

最开始产品上线的时候,我们自己弄了一个服务器,用户量很少。大家也知道应用的特性,数据快速增长,我们天天还想着开发一些业务的功能,数据库性能也很差,用户工作量也很大。后来阿里云技术专家提了很多意见,和我们探讨怎么把自建服务器上环境迁移到云上面来。

上云之路

最开始我们用云的时候,买InnoDB的实例,性能很高,运维起来很简单。我们没有DBA,只有开发人员客串DBA。这时候还是有两个问题:第一,数据还是快速增长,数据存储成本肯定还会很高;第二,当时数据库实例是2TB,通过2TB的上线,这时候要做分库分表,再买个实例很麻烦。

MySQL的RDS是2个TB,hadoop是PB级别的。大家有没有想过一个问题,10个TB的数据和100个TB的数据也要用hadoop吗?有没有一类产品,它能够突破这个上线,因为MySQL我们用起来很熟悉,MySQL能不能支持大数据产品的应用。阿里云出来一个产品支持TokuDB存储引擎,5倍的压缩比。当时我们把一些事物处理放在InnoDB,OLAP放在TokuDB上。

aad7292f004e03c0a7fad8d769158faf5cda13f6

但问题又来了,TokuDB还是有上限的,后来出现了Hybrid,我的体会有几点:

第一,它依然是支持MySQL的,所以用起来不需要再去学习什么,很方便;

第二,它存储成本会相对低一些,因为它是SSD和SATA混合,也支持高压缩,TokuDB引擎在里面依然可以用;

第三,一份存储数据既可以做TP业务,也可以用AP业务。大家也知道要把这些数据拿出来做分析,要把数据拖到另外一个地方去,用之前准备工作太长,这个数据库好的地方在于我写一次,APP业务也可以在上面跑,有分布式数据库;

第四,直接可用,最后数据突破上限PB级。

其实产品出来之后,一样还存在问题,只读实例,成本线性增加、创建速度慢;数据备份,2TB、50小时。POLARDB一次性满足了我全部的幻想,我们作为一个不知名的厂商在做很小的产品,在解决一些很小的问题,使用POLARDB,我可以用很少的成本。   

 

使用云数据库的体会

云数据库用了这么久,在这几年用阿里云的数据库产品给我印象最深刻的是阿里云的价值观,他们能把客户放在第一位。

首先,它不怠慢客户。我们的产品在刚刚出来时也没有什么用处,只是自己有问题而已。在这个时候他们不会因为你是一个很小的客户,提出问题就不重视。我们从当时提出问题到现在阿里云推出的各个产品线,解决了当时提的问题,MySQL能不能支持大数据场景下的应用。

其次,积极互动。他们的产品有什么意见,他们会经常主动问意见。

第三点,阿里云的数据库有一个特点,你有什么新的需求我们就开发新的产品对应你。

第四点也是最重要的一点,坚持性价比。性价比很重要,我之所以用你,你的东西固然好,但必须得便宜,中小企业关注的是成本。

 

相关实践学习
如何快速连接云数据库RDS MySQL
本场景介绍如何通过阿里云数据管理服务DMS快速连接云数据库RDS MySQL,然后进行数据表的CRUD操作。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
5月前
|
存储 SQL 缓存
快手:从 Clickhouse 到 Apache Doris,实现湖仓分离向湖仓一体架构升级
快手 OLAP 系统为内外多个场景提供数据服务,每天承载近 10 亿的查询请求。原有湖仓分离架构,由离线数据湖和实时数仓组成,面临存储冗余、资源抢占、治理复杂、查询调优难等问题。通过引入 Apache Doris 湖仓一体能力,替换了 Clickhouse ,升级为湖仓一体架构,并结合 Doris 的物化视图改写能力和自动物化服务,实现高性能的数据查询以及灵活的数据治理。
快手:从 Clickhouse 到 Apache Doris,实现湖仓分离向湖仓一体架构升级
|
2月前
|
机器学习/深度学习 编解码 人工智能
超越Transformer,全面升级!MIT等华人团队发布通用时序TimeMixer++架构,8项任务全面领先
一支由麻省理工学院、香港科技大学(广州)、浙江大学和格里菲斯大学的华人研究团队,开发了名为TimeMixer++的时间序列分析模型。该模型在8项任务中超越现有技术,通过多尺度时间图像转换、双轴注意力机制和多尺度多分辨率混合等技术,实现了性能的显著提升。论文已发布于arXiv。
205 84
|
5天前
|
SQL 弹性计算 安全
【上云基础系列04】基于标准架构的数据库升级
本文回顾了业务上云从基础到进阶的理念,涵盖基础版和全栈版架构。在“入门级:上云标准弹性架构基础版”的基础上,本文针对数据库升级,重点介绍了高可用数据库架构的升级方案,确保数据安全和业务连续性。最后,附有详细的“上云标准弹性架构”演进说明,帮助用户选择合适的架构方案。
|
1月前
|
存储 数据采集 大数据
AllData数据中台技术架构升级演进
杭州奥零数据科技有限公司成立于2023年,专注于数据中台业务,维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务,支持AI大模型应用,助力企业高效利用数据价值。
|
2月前
|
SQL 存储 分布式计算
Paimon助力数据湖仓架构实时化升级
本次分享由阿里云高级技术专家李劲松介绍Paimon助力数据湖仓架构实时化升级。内容涵盖四个部分:1) 数据架构的存储演进,介绍Data LakeHouse结合的优势;2) Paimon实时数据湖,强调其批流一体和高效处理能力;3) 数据湖的实时流式处理,展示Paimon在时效性提升上的应用;4) 数据湖非结构化处理,介绍Paimon对非结构化数据的支持及AI集成。Paimon通过优化存储格式和引入LSM技术,实现了更高效的实时数据处理和查询性能,广泛应用于阿里巴巴内部及各大公司,未来将进一步支持AI相关功能。
|
4月前
|
存储 消息中间件 人工智能
ApsaraMQ Serverless 能力再升级,事件驱动架构赋能 AI 应用
本文整理自2024年云栖大会阿里云智能集团高级技术专家金吉祥的演讲《ApsaraMQ Serverless 能力再升级,事件驱动架构赋能 AI 应用》。
204 14
|
3月前
|
搜索推荐
|
3月前
|
人工智能 Cloud Native 算法
|
4月前
|
分布式计算 大数据 Serverless
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
在2024云栖大会开源大数据专场上,阿里云宣布推出实时计算Flink产品的新一代向量化流计算引擎Flash,该引擎100%兼容Apache Flink标准,性能提升5-10倍,助力企业降本增效。此外,EMR Serverless Spark产品启动商业化,提供全托管Serverless服务,性能提升300%,并支持弹性伸缩与按量付费。七猫免费小说也分享了其在云上数据仓库治理的成功实践。其次 Flink Forward Asia 2024 将于11月在上海举行,欢迎报名参加。
319 6
云栖实录 | 开源大数据全面升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展
|
3月前
|
机器学习/深度学习 存储 人工智能
政务部门人工智能OCR智能化升级:3大技术架构与4项核心功能解析
本项目针对政务服务数字化需求,建设智能文档处理平台,利用OCR、信息抽取和深度学习技术,实现文件自动解析、分类、比对与审核,提升效率与准确性。平台强调本地部署,确保数据安全,解决低质量扫描件、复杂表格等痛点,降低人工成本与错误率,助力智慧政务发展。

热门文章

最新文章