本场景将提供一台AnalyticDB MySQL湖仓版实例(简称ADB)。通过本教程的操作,您可以在ADB实例上一键导入TPCH内表数据集,导入后自动生成查询脚本。然后在ADB控制台-SQL开发功能中运行复杂脚本语句,帮助您快速上手ADB湖仓版,并实现海量数据秒级分析。

背景知识

AnalyticDB MySQL是阿里云瑶池数据库旗下的一款云原生数仓产品。旨在提供高性能、低成本的数据处理和数据分析服务,做到高度兼容MySQL,毫秒级更新,亚秒级查询。ADB包含湖仓版和数仓版,其中湖仓版是数仓版的升级版本,在全面兼容数仓版的能力上(资源组隔离、冷热数据分层、分时弹性等),新增Spark计算引擎、开源数据格式Hudi/Delta支持等,同时在产品能力上,也新增了数据接入、SQL开发、Spark开发、作业调度、资源按需弹性等功能,可无缝替换CDH/TDH/Databricks/Presto/Spark/Hive等,非常适合既有ETL诉求,又有实时分析的客户。ADB在营销圈人、游戏日志分析、广告投放、BI报表/大屏展示等场景均有很多落地并且成熟的案例。

  • TPCH数据集

TPC-H(商业智能计算测试)是美国交易处理效能委员会(TPC,Transaction Processing Performance Council)组织制定的用来模拟决策支持类应用的一个测试集。目前在学术界和工业界普遍采用它来评价决策支持技术方面应用的性能。TPC-H是根据真实的生产运行环境来建模,模拟了一套基于销售系统的数据仓库和相关数据集。TPCH-数据集共包含8张表,数据量可设定从GB到TB不等,本教程中数据集大小为10GB。其测试共包含了22个查询,主要评价指标各个查询的响应时间,即从提交查询到结果返回所需时间。其测试结果可综合反映系统处理查询时的能力。

  • 查询脚本

TPCH数据集配套的22条查询语句,

  • SQL开发

ADB湖仓版内置SQL编辑器功能,可用于SQL开发,功能详情参考SQL开发

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等