外部工具连接SaaS模式云数据仓库MaxCompute实战——BI分析工具篇

简介: MaxCompute 是面向分析的企业级 SaaS 模式云数据仓库,以 Serverless 架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,帮助企业和大数据开发者经济并高效的分析处理海量数据。

本文直播作者 木弈 阿里云智能 产品经理


直播视频请点击 直播 观看。


本文将从六个方面讲解。

01 走进 MaxCompute 生态

02 商业智能(BI)分析工具概览

03 开源BI分析工具概览

04 JDBC 简介

05 PyODPS 简介

06 实操展示


下面开始我们第一部分的分享

一、走进 MaxCompute 生态

首先来看下 MaxCompute 产品能支持的外部工具,大概可以分为商业智能、开发管理、传输调度、编程接口。本次分享主要关注商业智能(BI)工具这一板块,可以看到 MaxCompute 官方集成有Tableau、FineReport、FineBI、Quick BI。其中Tableau、FineBI、FineReport是在特定的版本会内置 MaxCompute 驱动,如果需要通过JDBC连接 MaxCompute ,还是需要手动加载 MaxCompute JDBC驱动,Quick BI作为阿里云的产品,是可以通过阿里云账号和AK信息直接连接的,同时在8.6及以上版本的Yonghong Desktop也是可以通过内置驱动连接 MaxCompute。在商业智能部分还有开源BI工具,Superset、Davinci也可以连接 MaxCompute。


在开发管理部分,是我们第二讲要讲的内容,包括DBeaver、DataGrip、SQL Workbench/J。

同时我们的产品还集成了 Kafka和Flink开源引擎。支持的ETL开源工具有Kettle、Airflow、Azkaban,这一部分是在本季直播的第三讲来介绍。支持的编程接口有Python、JDBC、SQLAlchemy。


除了支持的外部工具,MaxCompute 自身也有开放生态,包括内建开源引擎 Spark,迁移工具MMA,开发生态PyODPS、Mars,工具生态Web-Console等。同时 MaxCompute 也与阿里云内部产品共同构建了丰富的解决方案生态和数据应用生态。


image.jpeg


二、商业智能(BI)分析工具概览

商业智能 (BI) 工具支持将计算引擎得到的数据通过仪表板、图表和其他图形输出提供数据可视化,以直观的形式展示给决策者,帮助高管和经理做出更明智的业务决策。


本页所展示的都是经过 MaxCompute 团队成员测试,可以成功连接 MaxCompute 表数据并进行数据可视化的BI工具。 本次重点介绍商业型BI工具,其中Tableau、FineBI、FineReport都是需要通过 MaxCompute JDBC驱动连接 MaxCompute。Quick BI和 Yonghong Desktop 可以通过产品内置驱动连接 MaxCompute。这些BI工具成功连接 MaxCompute 数据源后,可以进行列举数据库、列举表、查看表结构、查询表数据、查询视图等相关操作,打造数据报表。


1B3E5C15-D9B4-43C7-8379-CEA0E2F795EB.png


三、开源BI分析工具概览

MaxCompute 支持的开源BI工具主要是Davinci和Superset,分别是以JDBC和PyODPS做为连接驱动。

1.png

四、JDBC 简介

JDBC

JDBC(Java DataBase Connectivity)是一种用于执行SQL语句的Java API,可以为多种关系数据库提供统一访问,它由一组用Java语言编写的类和接口组成。简单来说就是用Java语言向数据库发送SQL语句来操作数据库。


MaxCompute JDBC 驱动

MaxCompute JDBC 驱动是 MaxCompute 提供的可以访问 MaxCompute 的JDBC接口。您可以通过标准的JDBC 接口基于 MaxCompute 执行海量数据的分布式计算查询。MaxCompute JDBC 驱动还可以用于连接MaxCompute 和支持 JDBC 的工具。


MaxCompute 相关基本参数信息

•URL:jdbc:odps:<MaxCompute_endpoint>?project=<MaxCompute_project_name>

  • :必填。MaxCompute项目所属区域的Endpoint。
  • :必填。待连接的目标MaxCompute项目名称。此处为MaxCompute项目名称,非工作空间名称。

•User:有访问指定项目权限的AccessKey ID。

•Password :AccessKey ID对应的AccessKey Secret。


FD99B6C1-AE33-49B9-987B-5B260E7B3F1F.png

五、PyODPS 简介

PyODPS是MaxCompute的Python SDK,提供DataFrame框架和MaxCompute对象的基本操作方法。您可以通过MaxCompute轻松地分析数据。

PyODPS 支持Python 2.6 以上的 Python 版本,包括Python 3。系统安装了 pip 后,只需运行:

pip install 'git+http://gitlab-ci-token:c60faf31b1f475342c790cca880e06@gitlab-sc.alibaba-inc.com/odps/pyodps.git'

PyODPS 的相关依赖会自动安装。

注意,对于Linux和Mac用户,先安装Cython,再运行安装pyodps命令,能加速Tunnel的上传和下载。

常用参数信息

:MaxCompute项目所属区域的Endpoint。

:待连接的目标MaxCompute项目名称。

User: 有访问指定项目权限的AccessKey ID。

Password :AccessKey ID对应的AccessKey Secret。


六、实操展示

FinBI实操展示

请点击 视频查看实操部分


Superset实操展示

请点击 视频 查看实操部分


其他BI工具接入

工具

版本要求

接入办法

其他资源

  • Tableau:Desktop 2019.4及更高版本
  • MaxCompute:JDBC驱动 3.0.1及以上版本

快速接入Tableau<官方集成>

  • FineBI:v5.1.9及更高版本
  • MaxCompute:JDBC驱动 3.2.8及以上版本

快速接入FineBI<官方集成>

  • FineReport:v10.0及更高版本
  • MaxCompute:JDBC驱动 3.2.8及以上版本

快速接入FineReport<官方集成>

  • Yonghong Desktop:v8.6及更高版本

快速接入永洪BI

  • QuickBI:无特殊要求

快速接入QuickBI

图片 1.png

  • Davinci:无特殊要求

快速接入Davinci

图片 1.png

  • Superset:无特殊要求

快速接入Superset



更多关于大数据计算、云数仓技术交流,欢迎扫码加入 “MaxCompute开发者社区” 钉钉群

晋恒2群.jpg

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
5月前
|
存储 SQL 机器学习/深度学习
一文辨析:数据仓库、数据湖、湖仓一体
本文深入解析数据仓库、数据湖与湖仓一体的技术原理与适用场景。数据仓库结构严谨、查询高效,适合处理结构化数据;数据湖灵活开放,支持多模态数据,但治理难度高;湖仓一体融合两者优势,实现低成本存储与高效分析,适合大规模数据场景。文章结合企业实际需求,探讨如何选择合适的数据架构,并提供湖仓一体的落地迁移策略,助力企业提升数据价值。
一文辨析:数据仓库、数据湖、湖仓一体
存储 数据采集 大数据
163 0
|
7月前
|
机器学习/深度学习 供应链 算法
仓库一多就乱套?你可能缺的不是人,而是懂大数据的脑子!
仓库一多就乱套?你可能缺的不是人,而是懂大数据的脑子!
152 0
|
7月前
|
数据可视化 BI API
无缝对接云数据库:自定义报表生成工具在混合云环境下的部署指南
自定义报表生成工具通过拖拽设计、多数据源整合及自动化输出,帮助业务人员零代码创建个性化报表,解决传统工具灵活性不足、技术门槛高的问题。文章对比其与传统报表差异,列举行业应用场景(如财务、零售),并给出选型建议与主流工具(如FineReport、Power BI、板栗看板)的优劣势分析。
282 0
|
9月前
|
SQL 分布式计算 大数据
大数据新视界 --大数据大厂之Hive与大数据融合:构建强大数据仓库实战指南
本文深入介绍 Hive 与大数据融合构建强大数据仓库的实战指南。涵盖 Hive 简介、优势、安装配置、数据处理、性能优化及安全管理等内容,并通过互联网广告和物流行业案例分析,展示其实际应用。具有专业性、可操作性和参考价值。
大数据新视界 --大数据大厂之Hive与大数据融合:构建强大数据仓库实战指南
|
10月前
|
数据可视化 数据挖掘 数据建模
数据可视化工具大比拼:从Tableau到Power BI,谁才是你的最佳拍档?
数据可视化工具大比拼:从Tableau到Power BI,谁才是你的最佳拍档?
1332 12
|
10月前
|
SQL 自然语言处理 数据可视化
📊 Quick BI 真实体验评测:小白也能快速上手的数据分析工具!
作为一名软件开发工程师,我体验了阿里云的Quick BI工具。从申请试用账号到上传数据、创建数据集,再到搭建仪表板和使用智能小Q功能,整个过程流畅且简单易用。尤其对非专业数据分析人士来说,拖拽式设计和自然语言问数功能极大降低了操作门槛。虽然在试用入口明显度和复杂语义理解上还有提升空间,但整体体验令人满意。Quick BI让我改变了对数据分析的认知,值得推荐给需要快速制作报表的团队成员。
|
12月前
|
关系型数据库 数据库 数据安全/隐私保护
云数据库实战:基于阿里云RDS的Python应用开发与优化
在互联网时代,数据驱动的应用已成为企业竞争力的核心。阿里云RDS为开发者提供稳定高效的数据库托管服务,支持多种数据库引擎,具备自动化管理、高可用性和弹性扩展等优势。本文通过Python应用案例,从零开始搭建基于阿里云RDS的数据库应用,详细演示连接、CRUD操作及性能优化与安全管理实践,帮助读者快速上手并提升应用性能。
|
存储 分布式计算 大数据
大数据揭秘:从数据湖到数据仓库的全面解析
大数据揭秘:从数据湖到数据仓库的全面解析
391 19
|
存储 SQL 分布式计算
MaxCompute 在大规模数据仓库中的应用
【8月更文第31天】随着大数据时代的到来,企业面临着海量数据的存储、处理和分析挑战。传统的数据仓库解决方案在面对PB级甚至EB级的数据规模时,往往显得力不从心。阿里云的 MaxCompute(原名 ODPS)是一个专为大规模数据处理设计的服务平台,它提供了强大的数据存储和计算能力,非常适合构建和管理大型数据仓库。本文将探讨 MaxCompute 在大规模数据仓库中的应用,并展示其相对于传统数据仓库的优势。
421 0

相关产品

  • 云原生大数据计算服务 MaxCompute