阿里云线上峰会已经开启!融合分布式、弹性计算与云计算的数据仓库长什么样?

本文涉及的产品
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS MySQL DuckDB 分析主实例,集群系列 4核8GB
RDS DuckDB + QuickBI 企业套餐,8核32GB + QuickBI 专业版
简介: 阿里云峰会今天正式开启了 !!

5-6-3.gif

阿里云峰会地址
头号云话题地址

2020年6月9日,“全速重构”2020阿里云·线上峰会即将隆重召开。在此次峰会上,阿里云数据库重磅发布云原生分布式数据库 PolarDB-X 、云原生数据仓库AnalyticDB、数据库自治服务DAS、云数据库专属集群、图数据库GDB、云数据库Cassandra版、云数据库ClickHouse 7款跨时代产品,用技术倾情打造新数字时代的基石!今天小编为大家倾情呈现颠覆传统数据仓库,新一代云原生数据仓库AnalyticDB(ADB)的产品亮点!

遵循摩尔定律发展,在第四次产业技术革命推动下云计算致使计算能力爆炸,导致数据增长非常迅速。到2020年全球会有40个ZB的数据,2015年已经产生了8.5ZB数据,中国占全球的22%。随着云计算和大数据等技术发展和应用更加成熟,云计算及大数据分析成为企业生存的水电煤,成为一种基础资源。与此同时,诸多行业领域的大数据分析平台都暴露出了严重的问题,这些问题主要体现在实时决策、体系结构、数据处理和存储等方面。

企业需要怎样的大数据分析平台?

数据的重要性不言而喻,但用户需要怎样的数据平台与服务却并不是三言两语就能说清的一件事。企业在数据仓库的解决方案中最需要的价值服务在哪里?

1、性能(Performance)

无论在什么行业,客户一定会要求:快!更快!性能是数据平台的准入门槛。如何在PB级别的海量数据量面前展现优秀的性能,同时尽可能的降低成本,是传统数据仓库的死穴。只有借助云端的资源才有可能在这个数量级上讨论这些问题。

2、实时(Realtime)

在self-BI的时代,终端用户不用通过IT生成报表,数据要求越发实时性,用户需要分析几小时甚至几分钟之前的数据,而不仅仅满足昨天的数据。

3、高效(Efficient)

随着国内互联网网民数和移动用户数饱和,人口红利消失,从增量市场进入存量市场,存量市场竞争更加激烈。在这种环境下,如何用最小的成本,挖掘最大的流量价值,简单、快速和高效为企业带来新的业务增长点,为大多数企业所追逐。

基于此,颠覆传统数据仓库,满足企业数据仓库更高需求的新一代云原生数据仓库AnalyticDB即将正式发布!

云原生数据仓库AnalyticDB融合了分布式、弹性计算与云计算的优势,在性能、实时、高效和规模四个方面具有极大的突破。云原生数据仓库AnalyticDB支持更大规模的并发访问、更快读写能力以及更智能的混合查询负载管理等,实现更精细化的资源利用和更低成本的投入,让用户能更加专注于业务发展,专注于数据价值。

1、超大规模

基于强一致RAFT协议的副本同步机制,最高每秒千万级的实时写入性能,支持最大100PB的存储空间。

2、强劲性能

轻量的索引构建方式、分布式混合计算引擎和优化器,具有承载更快和更复杂读写能力。ADB最新发布的性能白皮书显示,其性能相比MySQL有100倍的优势。数据仓库权威榜单:ADB包揽TPC-DS、TPC-H两大核心领域权威评测全球第一!

· 再次刷新TPC-DS 10TB榜单成为全球第一,性能、性价比全球领先!相比前世界纪录Spark优化版,综合性能提升29%,单位成本仅为其1/3。

· 首次刷新TPC-H 30TB当前有效榜单纪录成为全球第一,性能、性价比全球领先!相比前世界纪录 微软SQL Server 2019,综合性能提升290%,单位成本仅为其1/4,成为中国首次荣登该榜单的产品!

3、灵活弹性

基于存储计算分离架构,存储空间可以秒级扩容到100PB,计算资源快速从3节点升级到5000节点。ADB架构完美诠释了数据仓库产品的进化史,它被设计成为精准的制导导弹用于解决众多的历史遗留问题:花钱多、灵活度低和令人头疼的运营管理等。

4、融合计算和分析

随着移动互联网和智能化的快速发展,产生了大量的非结构数据,如何能快速挖掘海量的非结构化数据价值,尤其重要。ADB支持海量结构化和非结构化数据融合分析,在线分析和ETL计算一体化。实现了数据库和大数据一体化进程,可以帮助客户简单快速搭建数据仓库,使客户专心于业务上的开发以及业务价值提升。

传统数据仓库提供商,例如Hadoop,Hive,Spark这样的开源大数据平台,似乎在很大程度上和AnalyticDB形成了直接的竞争关系。但为什么传统的数据仓库(DW)和商业智能(BI)越来越被被疏远呢,为什么大家开始对数据仓库讳莫如深呢?

传统的数据仓库给人留下过许多不好的印象:花钱多, 灵活度低,令人头疼的运维等等。好在云原生数据仓库AnalyticDB发布了,利用云计算的壳解释了现代数据仓库存在的合理性。AnalyticDB会是数据仓库的终极形态吗?我们拭目以待!

今天阿里云线上峰会就要和大家见面啦
数据库专场的观看地址已为大家准备好了
扫码立即预约感兴趣的话题吧!
(Tips:记得登陆预约哦)

🔸01、云原生数据库与数据仓库新品发布——全面拥抱云原生
演讲者:飞刀

image.png

🔸02、头号云话题:新技术上场,我们去哪儿?
别人关心你飞的高不高,我却关心你过的好不好,2020年变化太多,当新技术商上场,我们该何去何从呢,幽默不失智慧,尽在明天的头号云话题中,等你!
嘉宾:飞刀、呼兰、盖国强、陈刚
预约观看扫这里👇
image.png

🔸03、全球首个数据库自动驾驶云平台DAS重磅发布
演讲者:广望
image.png

🔸04、云数据库新产品重磅发布——全球首发,引流云数据库浪潮
演讲者:斗佛
image.png

🔸05、技术专家联手深度解读PolarDB-X云原生核心技术揭秘和X-EngineRDS低成本存储解决方案
演讲者:七锋、曲山

image.png

🔸06、数据价值在线化 云原生数据仓库AnalyticDB与云原生数据湖Data Lake Analytics

演讲者:离哲

image.png

🔸07、数据库自动驾驶服务DAS的挑战与实践
演讲者:朱旭

image.png

相关实践学习
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
目录
相关文章
|
11月前
|
存储 关系型数据库 分布式数据库
喜报|阿里云PolarDB数据库(分布式版)荣获国内首台(套)产品奖项
阿里云PolarDB数据库管理软件(分布式版)荣获「2024年度国内首版次软件」称号,并跻身《2024年度浙江省首台(套)推广应用典型案例》。
|
并行计算 PyTorch 算法框架/工具
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
本文探讨了如何通过技术手段混合使用AMD与NVIDIA GPU集群以支持PyTorch分布式训练。面对CUDA与ROCm框架互操作性不足的问题,文章提出利用UCC和UCX等统一通信框架实现高效数据传输,并在异构Kubernetes集群中部署任务。通过解决轻度与强度异构环境下的挑战,如计算能力不平衡、内存容量差异及通信性能优化,文章展示了如何无需重构代码即可充分利用异构硬件资源。尽管存在RDMA验证不足、通信性能次优等局限性,但该方案为最大化GPU资源利用率、降低供应商锁定提供了可行路径。源代码已公开,供读者参考实践。
1418 3
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
|
人工智能 新能源 调度
中国信通院栗蔚:云计算与AI加速融合,如何开启智算时代新纪元?
中国信通院栗蔚:云计算与AI加速融合,如何开启智算时代新纪元?
612 17
|
人工智能 分布式计算 大数据
MaxFrame 产品评测:大数据与AI融合的Python分布式计算框架
MaxFrame是阿里云MaxCompute推出的自研Python分布式计算框架,支持大规模数据处理与AI应用。它提供类似Pandas的API,简化开发流程,并兼容多种机器学习库,加速模型训练前的数据准备。MaxFrame融合大数据和AI,提升效率、促进协作、增强创新能力。尽管初次配置稍显复杂,但其强大的功能集、性能优化及开放性使其成为现代企业与研究机构的理想选择。未来有望进一步简化使用门槛并加强社区建设。
713 8
|
机器学习/深度学习 分布式计算 数据挖掘
MaxFrame 性能评测:阿里云MaxCompute上的分布式Pandas引擎
MaxFrame是一款兼容Pandas API的分布式数据分析工具,基于MaxCompute平台,极大提升了大规模数据处理效率。其核心优势在于结合了Pandas的易用性和MaxCompute的分布式计算能力,无需学习新编程模型即可处理海量数据。性能测试显示,在涉及`groupby`和`merge`等复杂操作时,MaxFrame相比本地Pandas有显著性能提升,最高可达9倍。适用于大规模数据分析、数据清洗、预处理及机器学习特征工程等场景。尽管存在网络延迟和资源消耗等问题,MaxFrame仍是处理TB级甚至PB级数据的理想选择。
407 6
|
人工智能 监控 开发者
阿里云PAI发布DeepRec Extension,打造稳定高效的分布式训练,并宣布开源!
阿里云PAI发布DeepRec Extension,打造稳定高效的分布式训练,并宣布开源!
374 0
|
运维 Kubernetes 调度
阿里云容器服务 ACK One 分布式云容器企业落地实践
阿里云容器服务ACK提供强大的产品能力,支持弹性、调度、可观测、成本治理和安全合规。针对拥有IDC或三方资源的企业,ACK One分布式云容器平台能够有效解决资源管理、多云多集群管理及边缘计算等挑战,实现云上云下统一管理,提升业务效率与稳定性。
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
673 2
|
存储 人工智能 安全
云计算与网络安全:技术融合与挑战
在数字化时代的浪潮中,云计算和网络安全已成为推动社会进步的两大关键技术。本文将探讨云计算服务的发展,网络安全的重要性,以及信息安全技术的演进。我们将通过实例分析,揭示云服务如何增强数据保护,网络安全措施如何应对新兴威胁,以及信息安全技术的创新如何为企业带来竞争优势。文章旨在为读者提供对云计算和网络安全领域的深入理解,并展示它们如何共同塑造我们的未来。