阿里云MaxCompute被Forrester评为全球云端数据仓库领导者

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 参考消息网3月19日报道 日前,全球权威调研机构佛瑞斯特研究公司(Forrester)发布《2018年一季度云端数据仓库》报告。报告对大数据服务商的主要功能、区域表现、细分市场和典型客户等进行了全面评估,最终AWS、阿里云、谷歌、微软四大巨头杀入全球一线阵营。

参考消息网3月19日报道 日前,全球权威调研机构佛瑞斯特研究公司(Forrester)发布《2018年一季度云端数据仓库》报告。报告对大数据服务商的主要功能、区域表现、细分市场和典型客户等进行了全面评估,最终AWS、阿里云、谷歌、微软四大巨头杀入全球一线阵营。阿里云成为唯一入选的中国科技公司。

 ed4fed29ee023671fde4cf9684187c12dbc54cb8

Forrester报告被认为是全球各大公司CIO选择服务商的指导手册,在行业内极具权威性。云端的大数据服务凭借安全、弹性伸缩、部署速度快、成本低等特点,已经成为近年来的发展趋势。与之相应的,本地部署的大数据分析解决方案正在逐渐落伍。

此次Forrester评估中要求的每个供应商应具备有以下内容:1)成熟的大数据仓库产品; 2)独立的大数据仓库解决方案; 3)大数据使用案例; 4)公开发行售卖的产品; 5)区域市场领先性;6)技术的先进性;

阿里云MaxCompute作为本次入选的中国产品,Forrester在报告中对其进行了详细分析。

接下来,我们率先对本次入选的阿里云大数据计算服务MaxCompute进行公开解读。

1)产品成熟度方面

2009年,阿里巴巴遇到了Greenplum的天花板,Greenplum在百台机器,1000TB之后就很难再扩展上去了,但是即便是百台机器的规模对于阿里这样蓬勃发展的企业而言是远远不够的。

2009年9月,阿里云启动飞天大数据平台研发,愿景是要做一整套自研EB级数据仓库MaxCompute。

 8a83665fbdd318c01af5bf5dec173e29c7e04705

 

2)产品功能

云端的大数据服务凭借安全、弹性伸缩、部署速度快、成本低、等特点,已经成为近年来的发展趋势。去年Forrester提出,CDW企业虽然具备着良好的云上特性,但同时很多云厂商也暴露出一些不足,如服务全球化、数据安全、集成、建模和治理;

MaxCompute一直侧重于全球化、性能、安全、一站式的端到端的开发体验和生态方面的进一步改进。

 

全球化

MaxCompute目前在香港、新加坡、日本、迪拜、欧洲、美国西部、美国东部、澳大利亚、印尼、印度等全球 15个区域,将百万级服务器连成一台超级计算机,以在线公共服务的方式为全球主要互联网市场提供计算能力。

 0bdb9d1b043cc6c5b9d39d6d3ab586167aeeb13a

性能

MaxCompute EB级别性能处理达到了全球领先性。2017年10月份,完成全球首次基于公共云的100TB  BigBench大数据基准测试,性能突破7830QPM。

 

开发效率

提出了结合Declarative和Imperative优势的新一代大数据语言 NewSQL,突破了以往SQL语言的技术限制,将编程语言统一,支持离线、准实时、流、图、机器学习等多种计算模式及非结构化处理,大幅降低大数据开发门槛。

 

安全

提出了多租户云安全隔离技术,突破了传统大数据平台的安全局限,将安全边界细化到用户、进程、内核级别。支撑了百万级租户、单日百亿级任务的授权与审计,实现金融级别数据安全保障。

 

数据建模、治理、集成

面向各行各业大数据建设、管理及应用诉求,MaxCompute提供一站式从数据接入到数据消费全链路的智能数据构建与管理的大数据能力工具, 包括DataWorks、MaxCompute Studio等,助力打造标准统一、融会贯通、资产化、服务化、闭环自优化的智能数据体系,以驱动创新。

 

3)技术的先进性

       2015年,飞天在Sort Benchmark排序竞赛中刷新GraySort/MinuteSort四项世界记录

      FuxiSort排序100TB数据用时377秒

      基于共享的测试环境,双千兆网卡、机械磁盘

       2016年,飞天在Sort Benchmark排序竞赛中刷新CloudSort两项世界记录

      NADSort排序100TB数据,花费$144( $1.44/TB)

      2017年,MaxCompute适配了TPC benchmark,将数据规模拓展至100TB,完成全球首次基于公共云的BigBench大数据基准测试,性能突破8200QPM,实现了中国计算、世界能力。

       花费$354.7/QPM

 bbe500a7973ceeb4198474b1c95995e4a20a9d1c

资质方面

     已通过10项权威第三方行业/安全认证

a5baecb2843a457e2502dc4e692e74d0023e8639

 

4)区域市场领先性

阿里云作为全球领先的云计算厂商,服务230万客户,覆盖全球200多个国家和地区,公共云市场占有率为47.6%,为市场追随者的总和。大数据计算服务MaxCompute专注于为香港、新加坡、日本、迪拜、欧洲、美国西部、美国东部、澳大利亚、印尼、印度等全球 15个区域的客户提供海量数据存储和大规模计算,把阿里云的卓越的计算能力输出给全球各地区客户。

 e93ecbd7d83327b2bf5fce11d95f0f1088392780

5)典型客户案例

ofo 小黄车

使用了MaxCompute之后,ofo开始建立数据模型、聚类,通过历史订单、人流信息学习出各地所需投放车数量,从何地收车,对冷区数据适当回收,对热区数据增加投放。2017年7月ofo从MaxCompute1.0升级到2.0,线下运营效率提高50%以上,轻松处理3200万日订单量,整体运行效率提升76%。同时,大数据平台运维成本大幅降低,只需投入0.5人,相比自建物理集群,使用阿里云MaxCompute的总成本有较大降低,应用开发效率有很大提高。


华大基因

基因技术从实验室逐渐进入生活场景,数据体量爆发式增长,远超出传统计算能力所能支持的范围。基于这样的背景,华大选择了MaxCompute。在百万人基因组项目中,对人群结构的分析,传统计算方式需3-5天,MaxCompute可使整个分析在1小时内完成,极大加速了数据吞吐和交付速度。在对百万人基因数据进行遗传结构分析时,计算复杂度使得传统计算无法支撑,利用MaxCompute,华大取得了技术突破,在几小时内完成一个人与十万人中所有遗传距离计算,计算成本大幅降低至1千美金以内,这样的例子华大基因还在不断开发中。

 

综上所述,阿里云MaxCompute提供基于公共云的多租户大数据仓库和混合云服务,全球化进展迅速,金融、互联网、零售、电子商务等是其主要业务领域。

凭借其9年的产品成熟度、技术领先性及一站式的大数据开发解决方案,成为CBW云端数据仓库市场的领导者。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
14天前
|
人工智能 Cloud Native 数据管理
媒体声音|重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
在2024云栖大会上,阿里云瑶池数据库发布了首个一站式多模数据管理平台DMS:OneMeta+OneOps。该平台由Data+AI驱动,兼容40余种数据源,实现跨云数据库、数据仓库、数据湖的统一数据治理,帮助用户高效提取和分析元数据,提升业务决策效率10倍。DMS已服务超10万企业客户,降低数据管理成本高达90%。
|
16天前
|
分布式计算 Java 开发工具
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。
|
1月前
|
人工智能 自然语言处理 关系型数据库
阿里云云原生数据仓库 AnalyticDB PostgreSQL 版已完成和开源LLMOps平台Dify官方集成
近日,阿里云云原生数据仓库 AnalyticDB PostgreSQL 版已完成和开源LLMOps平台Dify官方集成。
|
2月前
|
人工智能 分布式计算 DataWorks
连续四年!阿里云领跑中国公有云大数据平台
近日,国际数据公司(IDC)发布《中国大数据平台市场份额,2023:数智融合时代的真正到来》报告——2023年中国大数据平台公有云服务市场规模达72.2亿元人民币,其中阿里巴巴市场份额保持领先,占比达40.2%,连续四年排名第一。
200 12
|
2月前
|
SQL 人工智能 大数据
阿里云牵头起草!首个大数据批流融合国家标准发布
近日,国家市场监督管理总局、国家标准化管理委员会正式发布大数据领域首个批流融合国家标准GB/T 44216-2024《信息技术 大数据 批流融合计算技术要求》,该标准由阿里云牵头起草,并将于2025年2月1日起正式实施。
85 7
|
1月前
|
存储 小程序 Apache
10月26日@杭州,飞轮科技 x 阿里云举办 Apache Doris Meetup,探索保险、游戏、制造及电信领域数据仓库建设实践
10月26日,由飞轮科技与阿里云联手发起的 Apache Doris 杭州站 Meetup 即将开启!
54 0
|
2月前
|
SQL 人工智能 大数据
首个大数据批流融合国家标准正式发布,阿里云为牵头起草单位!
近日,国家市场监督管理总局、国家标准化管理委员会正式发布大数据领域首个批流融合国家标准 GB/T 44216-2024《信息技术 大数据 批流融合计算技术要求》,该标准由阿里云牵头起草,并将于2025年2月1日起正式实施。
|
3月前
|
存储 缓存 Cloud Native
MPP架构数据仓库使用问题之ADB PG云原生版本的扩缩容性能怎么样
MPP架构数据仓库使用问题之ADB PG云原生版本的扩缩容性能怎么样
MPP架构数据仓库使用问题之ADB PG云原生版本的扩缩容性能怎么样
|
4月前
|
SQL Cloud Native 关系型数据库
云原生数据仓库使用问题之分组优化如何实现
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
4月前
|
Cloud Native 关系型数据库 OLAP
云原生数据仓库操作报错合集之遇到“table does not exist”错误,该怎么办
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。

相关产品

  • 云原生大数据计算服务 MaxCompute