开发者社区> 问答> 正文

ODPS的使用性能比RDS的差,什么原因?

福利达人 2017-03-07 11:17:31 3696
问:ODPS(Maxcomput)是自带存储功能的。其中的BI报表功能可以使用RDS、ADS、ECS以及ODPS存储的数据进行计算,但对比下来,ODPS的明显比ADS的慢(主要是join,语句相同),什么原因?

答:
ApsaraDB For Greenplum是基于开源Greenplum打造的一种MPP、Shared Nothing 分析型数据库,有着卓越的查询性能。

提供丰富的机器学习库函数,扩展函数语言(R, python, perl),SQL 交互式接口。

使用RDS+ApsaraDB for Greenplum , 给分析师快速试错的舞台,数据产生价值,打造数据闭环。

ODPS 是任务型的产品,一个分析需要经历较长路径 : 建模、数据抽取、任务部署、任务调度、任务执行、返回结果、查看结果。

Greenplum是SQL接口,开箱即用,分析路径大大缩短,帮助飞速发展的企业提供快速的建模试错舞台。 快速让您的数据产生价值。

《PostgreSQL 物流调度算法探索 - 基于PostGIS/pgrouting/机器学习》
https://yq.aliyun.com/articles/57857

《Greenplum 分布列与分区的黄金法则》
https://yq.aliyun.com/articles/57822

《阿里云ApsaraDB RDS用户 - OLAP最佳实践》
https://yq.aliyun.com/articles/57778

《Greenplum 资源隔离的原理与源码分析》
https://yq.aliyun.com/articles/57763

《三张图读懂Greenplum在企业的正确使用姿势》
https://yq.aliyun.com/articles/57736

《聊聊Greenplum的那些事》
https://yq.aliyun.com/articles/57606

by__德哥


答:
ODPS是存储、计算分离,用MR进行计算。且数据是按块无规律存放,每次计算都需要进行数据整理与加载,更适合于大、超大数据量的运算。

在小数据范围没法跟RDS这种存储、计算一体的对比。但在更大数据范围內,不是RDS做Scale-up能支持的,因此不具有可比性!

ADS是MPP, 在计算之前,数据是根据字段的值进行hash分片的; 因此数据相对有规律;且就地加载数据,只交换部分必要数据。 计算模型也比MR的三步骤要有优势,因此一定数据范围,在性能上ODPS可能会有差距。

从另一方面,MPP的架构本身也意味,其能承载的数据量上无法与ODPS对比。在更大数据量上,MPP架构有可能会因为数据交换等原因,网络成为瓶颈,与ODPS无法对比。

ApsaraDB For Greenplum是基于开源Greenplum打造的一种MPP、Shared Nothing 分析型数据库,在一定数据范围內有着卓越的查询性能。近期公测阶段,可以到这里查阅更多信息: https://www.aliyun.com/product/gpdb?spm=5176.7920929.237031.39.P7sS2g

by__窦贤明
存储 SQL 机器学习/深度学习 分布式计算 关系型数据库 OLAP 调度 MaxCompute Python RDS
分享到
取消 提交回答
全部回答(2)
  • 福利达人
    2017-03-15 20:03:08
    回 1楼(jesuiszb) 的帖子
    德哥说有就是有。
    0 0
  • 洵云
    2017-03-08 22:03:33
    阿里云没有ODPS产品吧

    -------------------------

    不好意思,今天云栖大会 上听了下德哥和其他老师的演讲才知道;原来max compute的前身就是odps。小的见识短了,别见怪;

    0 0
添加回答
+ 订阅

分享数据库前沿,解构实战干货,推动数据库技术变革

推荐文章
相似问题