ApsaraDB云数据库助力优驾产品升级和架构变革

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
云数据库 RDS PostgreSQL,集群系列 2核4GB
简介: 2017云栖大会POLARDB专场,广州通易科技有限公司技术负责人刘锬带来ApsaraDB云数据库助力优驾产品升级和架构变革的演讲。本文主要先介绍了优驾产品,接着介绍了应用需求与技术架构,最后分享了上云之路和使用云数据库的体会。

2017云栖大会POLARDB专场,广州通易科技有限公司技术负责人刘锬带来ApsaraDB云数据库助力优驾产品升级和架构变革的演讲。本文主要先介绍了优驾产品,接着介绍了应用需求与技术架构,最后分享了上云之路和使用云数据库的体会。

以下是精彩内容分享:

 

优驾产品

dd6024cd7c4ac611d7edc961e14e236ac72c82d4

我们做的产品是车联网的产品,最右边是连接汽车API的盒子,我们做APP连接盒子。我们出了一个旗舰产品,4G后视镜和车的连接大屏,产品本质上来讲就是AI助理,帮助大家解决一些用车的小问题,怎么开车出行,怎么精明养车等。

我们的产品深度支持100多个车品牌,我们能读出来的数据能力和专业4S店诊断仪诊断出来的数据一样。

 

应用需求与技术架构

8a4dc6d5bcd800ee036d9ac2cd922cc83fb2c407

这是数据的架构,车里传感器非常多,很多数据流都在汽车总线上跑。而车对外暴露一个API 16桢接口,把车和网络连接起来。盒子不管是和手机、平板、后视镜、车机,都是通过蓝牙连接,数据上传到云分析数据。

汽车里的数据流比我们想象当中要多,仪表上可见的都是数据流,仪表上不可见的也有各种各样数据流,还包括在车上能看到各种各样故障灯。假设有100个数据流,每个数据流都是在50毫秒产生一个数字的变化,这个时候数据量是很大的,比如在国庆期间,有一位用户大概15天的时间从广西南宁出发,然后把青藏线和川藏线全部走了一遍,跑了8千多公里,他把8千多公里数据在一个时间点提交传上来,他的数据一天行车1200公里,1200公里数据大概有50万条原始数据,还不是我们处理后的数据,这意味着8千公里大概就是350万条左右,一次性一个峰值一个用户就把数据提交上来,我们就很痛苦自己多出一个BUG,导致不正常。

a5a351e2a6d43f6cd701c5a40976bf7674002b13

现在数据库存储成本高,我们并没有把所有数据都存到数据库。大家知道一个应用只有10万个用户,其实是非常小的应用,但它的数据量很高。我们想要做的事情是在车出现异常之前发现它,发现它之后找到解决方案,我作为一个车主能不能去之前就知道车可能会怎么修,哪一个部件坏了,甚至于部件在网上哪个卖家卖得最便宜,这是我们想要解决的问题。

我们通过大数据预测车况异常,数据接进来之后用一些机器学习算法,包括专家的知识库做一个问题预测。然后能够把维修方案给出来,跟哪个部件有关,然后再去做维修配件电商全网比价,把所有电商上汽车配件全部抓下来,看它的价格比较,告诉你去哪一家买是最便宜的。这个应用的范围很广。

 

与云共舞

最开始产品上线的时候,我们自己弄了一个服务器,用户量很少。大家也知道应用的特性,数据快速增长,我们天天还想着开发一些业务的功能,数据库性能也很差,用户工作量也很大。后来阿里云技术专家提了很多意见,和我们探讨怎么把自建服务器上环境迁移到云上面来。

上云之路

最开始我们用云的时候,买InnoDB的实例,性能很高,运维起来很简单。我们没有DBA,只有开发人员客串DBA。这时候还是有两个问题:第一,数据还是快速增长,数据存储成本肯定还会很高;第二,当时数据库实例是2TB,通过2TB的上线,这时候要做分库分表,再买个实例很麻烦。

MySQL的RDS是2个TB,hadoop是PB级别的。大家有没有想过一个问题,10个TB的数据和100个TB的数据也要用hadoop吗?有没有一类产品,它能够突破这个上线,因为MySQL我们用起来很熟悉,MySQL能不能支持大数据产品的应用。阿里云出来一个产品支持TokuDB存储引擎,5倍的压缩比。当时我们把一些事物处理放在InnoDB,OLAP放在TokuDB上。

aad7292f004e03c0a7fad8d769158faf5cda13f6

但问题又来了,TokuDB还是有上限的,后来出现了Hybrid,我的体会有几点:

第一,它依然是支持MySQL的,所以用起来不需要再去学习什么,很方便;

第二,它存储成本会相对低一些,因为它是SSD和SATA混合,也支持高压缩,TokuDB引擎在里面依然可以用;

第三,一份存储数据既可以做TP业务,也可以用AP业务。大家也知道要把这些数据拿出来做分析,要把数据拖到另外一个地方去,用之前准备工作太长,这个数据库好的地方在于我写一次,APP业务也可以在上面跑,有分布式数据库;

第四,直接可用,最后数据突破上限PB级。

其实产品出来之后,一样还存在问题,只读实例,成本线性增加、创建速度慢;数据备份,2TB、50小时。POLARDB一次性满足了我全部的幻想,我们作为一个不知名的厂商在做很小的产品,在解决一些很小的问题,使用POLARDB,我可以用很少的成本。   

 

使用云数据库的体会

云数据库用了这么久,在这几年用阿里云的数据库产品给我印象最深刻的是阿里云的价值观,他们能把客户放在第一位。

首先,它不怠慢客户。我们的产品在刚刚出来时也没有什么用处,只是自己有问题而已。在这个时候他们不会因为你是一个很小的客户,提出问题就不重视。我们从当时提出问题到现在阿里云推出的各个产品线,解决了当时提的问题,MySQL能不能支持大数据场景下的应用。

其次,积极互动。他们的产品有什么意见,他们会经常主动问意见。

第三点,阿里云的数据库有一个特点,你有什么新的需求我们就开发新的产品对应你。

第四点也是最重要的一点,坚持性价比。性价比很重要,我之所以用你,你的东西固然好,但必须得便宜,中小企业关注的是成本。

 

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助     相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
3月前
|
文字识别 算法 API
视觉智能开放平台产品使用合集之人脸数据库容量是否支持扩容
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
存储 移动开发 数据库
视觉智能开放平台产品使用合集之人脸数据库容量是否支持扩容
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
3月前
|
数据采集 Oracle 关系型数据库
实时计算 Flink版产品使用问题之怎么实现从Oracle数据库读取多个表并将数据写入到Iceberg表
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
3月前
|
数据采集 DataWorks 安全
DataWorks产品使用合集之如何判断数据库类型是否支持整库
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
3月前
|
分布式计算 DataWorks 关系型数据库
DataWorks产品使用合集之ODPS数据怎么Merge到MySQL数据库
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
3月前
|
SQL Oracle 关系型数据库
实时计算 Flink版产品使用问题之Oracle数据库是集群部署的,怎么进行数据同步
实时计算Flink版作为一种强大的流处理和批处理统一的计算框架,广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器,提供了一套全面的解决方案,以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点,使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。
|
3月前
|
编解码 文字识别 算法
视觉智能开放平台产品使用合集之怎么查询人脸数据库列表
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
23 0
|
3月前
|
敏捷开发 测试技术 持续交付
阿里云云效产品使用合集之如何管理企业的组织架构
云效作为一款全面覆盖研发全生命周期管理的云端效能平台,致力于帮助企业实现高效协同、敏捷研发和持续交付。本合集收集整理了用户在使用云效过程中遇到的常见问题,问题涉及项目创建与管理、需求规划与迭代、代码托管与版本控制、自动化测试、持续集成与发布等方面。
|
3月前
|
运维 DataWorks 安全
DataWorks产品使用合集之只读实例数据库是否可以进行数据分析
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
3月前
|
存储 SQL 数据库
实时数仓 Hologres产品使用合集之如何查看当前数据库下的所有表和表属性
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。

热门文章

最新文章