外部工具连接SaaS模式云数仓MaxCompute 实战—— 数据库管理工具篇

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 本次直播将主要分享MaxCompute查询加速功能、数据库管理工具DBeaver、DataGrip、SQL Workbench/J的部分连接演示。

作者 木弈 阿里云智能 产品经理


直播视频请点击 直播 观看。


本次分享将从四个方面讲解。

01 上节回顾

02 数据库管理工具概览

03 实操展示

04 查询加速


一、上节回顾

在第一讲中我们主要讲了 MaxCompute 生态,重点介绍了商业BI工具,包括Tableau、FineReport、FineBI、Quick BI、Yonghong Desktop BI工具的连接原理以及实操的展示。本文主讲数据库管理工具,主要是开发管理部分的DataGrip、DBeaver、SQL Workbench/J。

MC生态0720(1).jpg

二、数据库管理工具概览

数据库管理工具,即数据库图形化工具,是数据库人员必需的工具之一,MaxCompute支持与DBeaver、DataGrip和SQL Workbench/J 通过JDBC驱动连接,并可以形象化方便快捷地进行列举数据库、列举表、查看表结构、查询表数据、建表、写表、建视图、查询视图等相关操作。

1.png

连接方式

JDBC

JDBC(Java DataBase Connectivity)是一种用于执行SQL语句的Java API,可以为多种关系数据库提供统一访问,它由一组用Java语言编写的类和接口组成。简单来说就是用Java语言向数据库发送SQL语句来操作数据库。


MaxCompute JDBC 驱动

MaxCompute JDBC 驱动是 MaxCompute 提供的可以访问 MaxCompute 的JDBC接口。您可以通过标准的JDBC 接口基于 MaxCompute 执行海量数据的分布式计算查询。MaxCompute JDBC 驱动还可以用于连接MaxCompute 和支持 JDBC 的工具。


MaxCompute 相关基本参数信息

•URL:jdbc:odps:<MaxCompute_endpoint>?project=<MaxCompute_project_name>

  • :必填。MaxCompute项目所属区域的Endpoint。
  • :必填。待连接的目标MaxCompute项目名称。此处为MaxCompute项目名称,非工作空间名称。

•User:有访问指定项目权限的AccessKey ID。

•Password :AccessKey ID对应的AccessKey Secret。

FD99B6C1-AE33-49B9-987B-5B260E7B3F1F.png


三、实操展示

DBeaver实操展示

请点击 视频 查看实操部分

其他实操文档

DataGrip连接MaxCompute

SQL Workbench/J连接MaxCompute


四、查询加速

MaxCompute 查询加速 – 针对实时性要求高的查询作业,全链路加快 MaxCompute 查询执行速度

使用MaxComputeSQL语法和引擎,针对近实时场景进行优化

系统自动进行查询优化选择,同时支持用户选择延时优先还是吞吐优先的执行方式

•针对近实时场景使用不同的资源调度策略:latencybased

•针对低延时要求的场景进行全链路优化独立执行资源池;多层次的数据和meta Caching;交互协议优化


1.png


QuickBI查询加速

1.png

其他工具查询加速-&interactiveMode=true

  • interactiveMode:可选。查询加速功能开关。如果您需要启用查询加速功能,在URL后追加&interactiveMode=true配置即可。更多查询加速功能信息,请参见查询加速


是否启动查询加速功能查询速度对比

使用Davinci测试对比

查询数据量

不使用查询加速功能

使用查询加速功能

1w

10s

3s

5w

12s

7s


对比实操视频

请点击 视频 查看实操部分


更多关于大数据计算、云数仓技术交流,欢迎扫码加入 “MaxCompute开发者社区” 钉钉群

晋恒2群.jpg

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
2月前
|
存储 SQL 监控
数据中台架构解析:湖仓一体的实战设计
在数据量激增的数字化时代,企业面临数据分散、使用效率低等问题。数据中台作为统一管理与应用数据的核心平台,结合湖仓一体架构,打通数据壁垒,实现高效流转与分析。本文详解湖仓一体的设计与落地实践,助力企业构建统一、灵活的数据底座,驱动业务决策与创新。
|
2月前
|
数据可视化 BI API
无缝对接云数据库:自定义报表生成工具在混合云环境下的部署指南
自定义报表生成工具通过拖拽设计、多数据源整合及自动化输出,帮助业务人员零代码创建个性化报表,解决传统工具灵活性不足、技术门槛高的问题。文章对比其与传统报表差异,列举行业应用场景(如财务、零售),并给出选型建议与主流工具(如FineReport、Power BI、板栗看板)的优劣势分析。
101 0
|
4月前
|
负载均衡 算法 关系型数据库
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
本文聚焦 MySQL 集群架构中的负载均衡算法,阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法,分析各自优缺点及适用场景。并提供 Java 语言代码实现示例,助力直观理解。文章结构清晰,语言通俗易懂,对理解和应用负载均衡算法具有实用价值和参考价值。
大数据大厂之MySQL数据库课程设计:揭秘MySQL集群架构负载均衡核心算法:从理论到Java代码实战,让你的数据库性能飙升!
|
4月前
|
存储 SQL 分布式计算
别让你的数据“裸奔”!大数据时代的数据隐私保护实战指南
别让你的数据“裸奔”!大数据时代的数据隐私保护实战指南
222 19
|
3月前
|
人工智能 分布式计算 大数据
大数据≠大样本:基于Spark的特征降维实战(提升10倍训练效率)
本文探讨了大数据场景下降维的核心问题与解决方案,重点分析了“维度灾难”对模型性能的影响及特征冗余的陷阱。通过数学证明与实际案例,揭示高维空间中样本稀疏性问题,并提出基于Spark的分布式降维技术选型与优化策略。文章详细展示了PCA在亿级用户画像中的应用,包括数据准备、核心实现与效果评估,同时深入探讨了协方差矩阵计算与特征值分解的并行优化方法。此外,还介绍了动态维度调整、非线性特征处理及降维与其他AI技术的协同效应,为生产环境提供了最佳实践指南。最终总结出降维的本质与工程实践原则,展望未来发展方向。
188 0
|
4月前
|
SQL 分布式计算 大数据
大数据新视界 --大数据大厂之Hive与大数据融合:构建强大数据仓库实战指南
本文深入介绍 Hive 与大数据融合构建强大数据仓库的实战指南。涵盖 Hive 简介、优势、安装配置、数据处理、性能优化及安全管理等内容,并通过互联网广告和物流行业案例分析,展示其实际应用。具有专业性、可操作性和参考价值。
大数据新视界 --大数据大厂之Hive与大数据融合:构建强大数据仓库实战指南
|
2月前
|
SQL 人工智能 分布式计算
拥抱数据洪流:ODPS,从工具到智能基石的认知跃迁
ODPS正从计算工具进化为智能基石,重塑数据价值链条。它不仅是效率引擎,更是决策资产、信任桥梁与预见系统。其创新架构支持存算分离、AI融合计算与隐私保护,助力企业迎接AI革命。未来,ODPS将推动绿色智能,成为组织数字化转型的核心支撑平台。
109 3
|
2月前
|
存储 SQL 分布式计算
MaxCompute x 聚水潭:基于近实时数仓解决方案构建统一增全量一体化数据链路
聚水潭作为中国领先的电商SaaS ERP服务商,致力于为88,400+客户提供全链路数字化解决方案。其核心ERP产品助力企业实现数据驱动的智能决策。为应对业务扩展带来的数据处理挑战,聚水潭采用MaxCompute近实时数仓Delta Table方案,有效提升数据新鲜度和计算效率,提效比例超200%,资源消耗显著降低。未来,聚水潭将进一步优化数据链路,结合MaxQA实现实时分析,赋能商家快速响应市场变化。
109 0

相关产品

  • 云原生大数据计算服务 MaxCompute