持续定义Saas模式云数据仓库+BI

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 简介:阿里云技术专家海清为大家带来持续定义Saas模式云数据仓库+BI的介绍。内容包括云数据仓库概述,BI使用场景与趋势,基于MaxCompute云数仓+BI的特性,以及实践案例。

云数据仓库概述

今天和大家一起探讨一下我们Saas模式下云数据仓库加上商业智能BI能有什么新的东西出来。我们先来看一下云数据仓库的一些概述。预测到2025年, 全球数据增长至175ZB, 中国数据量增长至48.6ZB。数据量暴涨这个前提下,我们看一下BI市场规模的增长。预测到2023年,我们中国BI软件市场年复合增长率为32%。云计算也同样在增速发展,2019年第四季中国云数据市场的增长率已经达到66.9%。

image.png

云数据仓库可以让企业几分钟内创建并开始使用数据仓库服务,在更低的成本下,专注业务,通过对大规模数据进行多样化的处理、挖掘、分析,快速获得业务洞察。它有四大特点:大规模数据分析,高性能,灵活扩容,低成本。

image.png

BI使用场景与趋势

商业智能(BI,Business Intelligence)是一种以提供决策分析性的运营数据为目的而建立的信息系统。随着我们社会发展以及数据量的爆发,在这么大量的数据支持之下,企业希望能快速从这些数据里边挖掘出更科学的一些数据,然后对我们的企业有一个科学化和数据化决策的帮助力。同时,BI也会助力企业用到一个精细化运营,客户关系维护,还有成本控制等。
我们看一下商业智能建立一个信息系统它主要的一个流程。首先是数据接入,将分散于我们企业内外各种数据集成和进行整合。然后再进入一个数据准备阶段,就是一个ETL的阶段。然后再到一个数据分析的阶段,最后将这些成果交给决策层,决策层就可以通过这数据进行一些决策。不管是精细化运营,还是客户维护关系,还是成本控制,都可以从这些数据里边得到一些助力。

image.png

随着数据量的暴涨,我们的业务快速的增长,产生了各种分析需求。不仅仅是分析多样,而且还想要实时的,比如说秒级的即时查询。同时在这么大量的数据基础上,数据的安全合规也越来越受到重视。所以需要快速的整合多系统数据和实现信息透明,以及构建一个统一的简单易用的可视化分析平台,提高制表效率。这已经成为BI系统的新的趋势。

image.png

基于MaxCompute云数仓+BI的特性

MaxCompute(原ODPS)是一项大数据计算服务,它能提供灵活快速、完全托管、高性能、低成本、安全的PB级数据仓库解决方案,使您可以经济并高效的分析处理海量数据。基于MaxCompute云数据仓库的基本架构如下图所示。底层的集群是MaxCompute本身搭建好的,用户无需感知。再往上,有多种的计算引擎。引擎之上提供各种的API,还有深度的集成了一个一站式大数据智能云研发平台DataWorks。在云数据仓库的这么一个体系下,可以做数据准备,进行各种清洗、加工、分析之后,就可以进入一个数据消费的阶段。

image.png

总结一下MaxCompute云数仓的特性。第一,是一个开箱即用的在线服务。免平台运维,总体拥有成本低。第二,极致弹性能力。弹性扩展,无需容量规划即可应对业务规模的快速变化。第三,简单易用,多功能计算服务。多种计算模型,多种数据通道,外部数据源联邦计算。第四,企业级安全能力。多租户安全保障机制,细粒度授权,数据加密、脱敏,备份恢复。第五,生态融合。支持多样数据源、生态工具和标准。

image.png

基于MaxCompute云数据仓库,我们和BI工具是如何对接的呢。MaxCompute主要是一个存储和计算服务,加上一个数据开发平台DataWorks,组成了一个离线的云数据仓库。在这之上,深度的集成了一个阿里云的Quick BI。它是一个分析报表工具,直接连接一MaxCompute的数据表即可以自己对这个表进行分析。还有第三方的一些工具,帆软,Tableau。同时我们在生态这一方面,JDBC同样也是支持。还有一些企业、一些客户对于商业智能这一块有更加多样化的一个需求或者个性的需求,现有对接的这些工具有可能不支持,那么它也可以通过SDK的方式来连接,从而实现基于MaxCompute云数据仓库对接的一个商业智能的信息平台。

image.png

我们看一下MaxCompute离线数仓是怎么实现一个高性能低延迟的分析查询。它可以直接读取离线数仓,支持多样化的查询分析,包括一些简单的查询、复杂的查询、点查询、联邦查询等等。它底层也可以有丰富的数据源,通过MaxCompute + Hologres组成一个交互式分析。这么一个大数据生态下,它都可以无缝的对接。比如说Quick BI,Tableau,帆软。所以它可以做到很快的上手,通过这么一个组合我们可以很快速的实现一个企业的信息平台。

image.png

实践案例

接下来我们看一下几个实践案例。

新零售的一个行业案例,需求背景: 基于Hadoop开源生态打造,软硬件维护成本高昂,稳定性问题不断,严重影响业务经营分析;线上业务爆发,需求积压严重,期望有整体解决方案,能够快速灵活支持业务发展所需的技术扩展。通过这么一个大数据解决方案,直接用了阿里云的Quick BI这个产品,实现了快速数智化转型,拥抱新零售,降低TCO的同时,更好的依托云上生态,实现数据资产业务化闭环。最终新零售这个案例,基于我们的MaxCompute + DataWorks,提高了他的数据业务的开发效率。

image.png

我们再看一个新金融的案例。需求背景:金融业务数据,对安全管控有极强要求,需要一个完整的安全管理体系,同时还要满足个性化安全需求;业务快速发展,需要能快速搭建、成本低、秒级扩展的数据中台体系。我们给客户创造的价值:基于MaxCompute开箱即用的应用满足其在安全审计过程中的数据安全需求,缩短了需求响应时间并满足其在数据安全上的个性化需求。

image.png

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
9月前
|
存储 自然语言处理 Cloud Native
云数据仓库ADB问题之全文索引检索字段过长时条件会失效如何解决
云数据仓库AnalyticDB是阿里云提供的一种高性能、弹性扩展的云原生数据仓库解决方案;本合集将深入探讨ADB的架构、性能调优、数据管理和应用场景等,以及如何解决在使用过程中可能出现的问题,提高数据仓库的使用效率。
154 4
|
9月前
|
SQL 运维 Cloud Native
云数据仓库ADB问题之数据导出失败如何解决
云数据仓库AnalyticDB是阿里云提供的一种高性能、弹性扩展的云原生数据仓库解决方案;本合集将深入探讨ADB的架构、性能调优、数据管理和应用场景等,以及如何解决在使用过程中可能出现的问题,提高数据仓库的使用效率。
166 2
|
9月前
|
SQL 关系型数据库 MySQL
在云数据仓库AnalyticDB MySQL版中,有几个参数可能影响SELECT查询的执行及其稳定性
在云数据仓库AnalyticDB MySQL版中,有几个参数可能影响SELECT查询的执行及其稳定性【1月更文挑战第16天】【1月更文挑战第80篇】
367 4
|
9月前
|
数据采集 监控 OLAP
云数据仓库ADB如何使用数仓版一键诊断功能-前提条件?
云数据仓库ADB如何使用数仓版一键诊断功能-前提条件?
119 0
|
9月前
|
分布式计算 运维 数据挖掘
MaxCompute是一个强大的云数据仓库服务
【4月更文挑战第1天】MaxCompute是一个强大的云数据仓库服务
121 1
|
6月前
|
SQL 数据挖掘 数据处理
“惊!云数据仓库ADB竟能这样玩?UPDATE语句单表、多表关联更新,一键解锁数据处理新境界!”
【8月更文挑战第7天】云数据仓库ADB提供高性能数据分析服务,支持丰富的SQL功能,包括关键的UPDATE语句。UPDATE可用于单表更新,如简单地增加员工薪资;亦支持多表关联更新,实现复杂数据关系处理。例如,结合departments表更新sales部门员工薪资。使用时需确保关联条件准确,考虑事务管理保证数据一致性,并优化性能以提升大规模更新效率。合理运用UPDATE增强数据仓库实用性和灵活性。
99 0
|
9月前
|
Cloud Native 关系型数据库 MySQL
云原生数据仓库产品使用合集之在云数据仓库ADB中,GROUP BY操作中出现NULL值,如何解决
阿里云AnalyticDB提供了全面的数据导入、查询分析、数据管理、运维监控等功能,并通过扩展功能支持与AI平台集成、跨地域复制与联邦查询等高级应用场景,为企业构建实时、高效、可扩展的数据仓库解决方案。以下是对AnalyticDB产品使用合集的概述,包括数据导入、查询分析、数据管理、运维监控、扩展功能等方面。
|
9月前
|
关系型数据库 专有云 MySQL
云数据仓库ADB问题之查询特慢如何解决
云数据仓库AnalyticDB是阿里云提供的一种高性能、弹性扩展的云原生数据仓库解决方案;本合集将深入探讨ADB的架构、性能调优、数据管理和应用场景等,以及如何解决在使用过程中可能出现的问题,提高数据仓库的使用效率。
129 6
|
9月前
|
SQL 监控 Cloud Native
云数据仓库ADB问题之创建物化视图时报错SQL错误如何解决
云数据仓库AnalyticDB是阿里云提供的一种高性能、弹性扩展的云原生数据仓库解决方案;本合集将深入探讨ADB的架构、性能调优、数据管理和应用场景等,以及如何解决在使用过程中可能出现的问题,提高数据仓库的使用效率。
115 5
|
9月前
|
Cloud Native 数据管理 OLAP
云数据仓库ADB问题之首次查询很慢如何解决
云数据仓库AnalyticDB是阿里云提供的一种高性能、弹性扩展的云原生数据仓库解决方案;本合集将深入探讨ADB的架构、性能调优、数据管理和应用场景等,以及如何解决在使用过程中可能出现的问题,提高数据仓库的使用效率。
124 5