【实验】阿里云大数据助理工程师认证(ACA)- QuickBI报表制作(上)

本文涉及的产品
智能商业分析 Quick BI,专业版 50license 1个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 【实验】阿里云大数据助理工程师认证(ACA)- QuickBI报表制作

实验概述

ABC公司是一家网上书城,用户可以通过网站下单订购书籍。为了使公司高层人员更好地了解网上书城的销售情况,需要制作一个销售分析报表。Quick BI能够提供海量数据实时在线分析,拖拽式操作、具有丰富的可视化效果。学生通过本实验将能根据场景独立地制作销售分析报表。


实验目的


能够使用Quick BI制作销售分析报表


了解不同场景下的图表应用


实验架构


阿里云QuickBI


第 1 章:实验背景


1.1 maxcompute


在弹出的左侧栏中,点击 创建资源 按钮,开始创建实验资源。

资源创建过程需要1-3分钟。完成实验资源的创建后,用户可以通过 实验资源 查看实验中所需的资源信息,例如:阿里云账号等


1.2 实验概述


ABC公司是一家网上书城,用户可以通过网站下单订购书籍。为了使公司高层人员更好地了解网上书城的销售情况,需要制作一个销售分析报表。Quick BI能够提供海量数据实时在线分析,拖拽式操作、具有丰富的可视化效果。学生通过本实验将能根据场景独立地制作销售分析报表。


1.3 实验目的


能够使用Quick BI制作销售分析报表
了解不同场景下的图表应用


1.4 实验架构


阿里云QuickBI


1.5 实验准备


本实验需要使用阿里云的Quick BI资源,具体步骤如下:


【注】本实验均在Google Chrome浏览器下测试运行,为了达到最大兼容,推荐使用Windows7以上的操作系统以及Chrome浏览器进行实验。


【注】一旦开始创建资源,该实验就开始计时,并在到达实验规定的时长时,将自动结束实验并清除资源。


进入实验后会出现如下界面,首先点击实验手册,然后点击附件下载,将附件下载到本地


20200711135312888.png

下载完成之后点击实验资源,然后点击创建资源按钮,如下图所示:

等待创建完成。创建完成后出现如下界面,点击复制控制台url的链接,然后使用浏览器的隐身窗口或使用其他浏览器打开

打开之后,将课程相关资源中的子用户名称填写到@的前方,然后点击下一步,如下图所示

输入课程相关资源中提供的子用户密码,然后点击登入

进入控制台的界面后,接下来的实验需要进入Quick BI。单击在管理控制台左侧导航栏的“产品与服务”,找到大数据(数加)下的“Quick BI”,点击它



20200711135404884.png


在主界面上会出现您尚未购买的页面,但是Quick BI提供了一个月的免费试用期。单击标准版30天试用申请,如下图所示:


20200711135430455.png


同意用户协议后即可试用Quick BI,点击进入Quick BI标准版按钮

进入Quick BI开发界面,如下图所示:


20200711135458763.png


第 2 章:实验详情


2.1 不同场景下的图形使用


首先我们练习一下使用Quick BI绘制图表:

  1. 柱图

20200711135537747.png


柱图,又称柱状图,是一种以长方形的长度来表达数值的统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况。适合用于展示二维数据集,其中一个轴表示需要对比的分类维度,另一个轴代表相应的数值,比如:(月份,商品销量),或者展示在一个维度上,多个同质可比的指标的比较,比如:(月份,苹果产量,桃子产量)。

它的优点是①简单直观,很容易根据柱子的长短看出值的大小 ②易于比较各组数据之间的差别,但是它不适合较大数据集的展示。与之相类似的有条形图、直方图、堆积图、百分比堆积图、双Y轴等。

2. 折线图


折线图用于显示数据在一个连续的时间间隔或者时间跨度上的变化,它的特点是反映事物随时间或有序类别而变化的趋势。需要注意的是折线图的数据记录数要大于2,可用于大数据量的趋势比较,但是同一个图上最好不要超过5条折线。它适合随时间具有变化趋势的数据集,适合不同情况下的趋势对比。


饼图

饼图多用于表示不同分类的占比情况,通过弧度大小来对比各种分类。


饼图不适用于多系列的数据,因为随着系列的增多,每个切片就会变小,最后导致大小区分不明显,同时多个饼图之间的数值也不好进行比较。饼图适用于比较一个数据分类上各个模块的大小占比的需求


【注】除了柱图、折线图、饼图外还有散点图、气泡图、漏斗图、雷达图等,本实验就不展开介绍了。


2.2 导入数据


  1. 单击“工作空间”


20200711135627645.png

  1. 导入本地数据

阿里云的Quick BI支持上传本地的Excel或CSV文件。以ABC网上书城的的销售数据为例。该文件可以在云中沙箱的实验附件中可以找到,可以直接单击文件名下载到本地。

依次单击 数据源 -> 上传文件,页面会跳转到添加数据源的界面上。



20200711135648624.png

在添加数据源页面单击“本地EXCEL文件”按钮


20200711135743895.png

单击后跳出上传页面,单击“选择文件”按钮,选择刚才下载的文件(booksales.xlsx)打开,如下所示:

20200711135809339.png


单击“确定”按钮,如下所示:


20200711135829441.png

单击“确定”按钮后,在右上角会出现“信息 导入成功,共69659条记录”,可以在右侧栏查看到“booksales”数据源,如下所示:


20200711135849596.png



单击“创建数据集” 按钮

页面会跳转至创建数据集窗口,确定数据集名称和位置,单击“确定”

20200711135917368.png


页面会跳转至数据集标签下,在“我的数据集”下可查看到刚才创建的“booksales”数据集,如下所示

20200711135936904.png

击“新建仪表板”,将会跳转到仪表板制作界面,如下所示:

20200711135958125.png

2.3 设置布局


销售分析报表的布局如下所示:

20200711140051912.png


20200711140106265.png


当前所处页面,如下所示:

20200711140126198.png


清空画布


点击图形右上方三个点按扭下的删除按钮,清空画布,如下所示:

20200711140208600.png


2. 清除水印


在最右上方的页面设置下的基础设置,可以选择不显示水印,如下所示:


20200711140228579.png

3. 设置布局一

20200711140249459.png

在上方仪表盘中,将鼠标置于区域色彩地图之上,单击色彩地图,如下所示:


20200711140310894.png

4. 设置布局二


20200711140332364.png


单击上方仪表板中的柱图,如下所示:


20200711140350568.png

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
21天前
|
人工智能 Cloud Native 数据管理
媒体声音|重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
在2024云栖大会上,阿里云瑶池数据库发布了首个一站式多模数据管理平台DMS:OneMeta+OneOps。该平台由Data+AI驱动,兼容40余种数据源,实现跨云数据库、数据仓库、数据湖的统一数据治理,帮助用户高效提取和分析元数据,提升业务决策效率10倍。DMS已服务超10万企业客户,降低数据管理成本高达90%。
|
22天前
|
分布式计算 大数据 BI
ClickHouse与大数据生态整合:从ETL到BI报表
【10月更文挑战第27天】在这个数据驱动的时代,企业越来越依赖于数据来做出关键决策。而高效的数据处理和分析能力则是支撑这一需求的基础。作为一位数据工程师,我有幸参与到一个项目中,该项目旨在利用ClickHouse与Hadoop、Spark、Flink等大数据处理框架的整合,构建一个从数据提取(Extract)、转换(Transform)、加载(Load)到最终生成商业智能(BI)报表的全流程解决方案。以下是我在这个项目中的经验和思考。
38 1
|
23天前
|
分布式计算 Java 开发工具
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。
|
2月前
|
人工智能 分布式计算 DataWorks
连续四年!阿里云领跑中国公有云大数据平台
近日,国际数据公司(IDC)发布《中国大数据平台市场份额,2023:数智融合时代的真正到来》报告——2023年中国大数据平台公有云服务市场规模达72.2亿元人民币,其中阿里巴巴市场份额保持领先,占比达40.2%,连续四年排名第一。
218 12
|
2月前
|
人工智能 Cloud Native 数据管理
重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
阿里云发布首个AI多模数据管理平台DMS,助力业务决策提效10倍
348 17
|
2月前
|
SQL 人工智能 大数据
阿里云牵头起草!首个大数据批流融合国家标准发布
近日,国家市场监督管理总局、国家标准化管理委员会正式发布大数据领域首个批流融合国家标准GB/T 44216-2024《信息技术 大数据 批流融合计算技术要求》,该标准由阿里云牵头起草,并将于2025年2月1日起正式实施。
88 7
|
2月前
|
SQL 人工智能 大数据
首个大数据批流融合国家标准正式发布,阿里云为牵头起草单位!
近日,国家市场监督管理总局、国家标准化管理委员会正式发布大数据领域首个批流融合国家标准 GB/T 44216-2024《信息技术 大数据 批流融合计算技术要求》,该标准由阿里云牵头起草,并将于2025年2月1日起正式实施。
|
2月前
|
存储 SQL 分布式计算
Java连接阿里云MaxCompute例
要使用Java连接阿里云MaxCompute数据库,首先需在项目中添加MaxCompute JDBC驱动依赖,推荐通过Maven管理。避免在代码中直接写入AccessKey,应使用环境变量或配置文件安全存储。示例代码展示了如何注册驱动、建立连接及执行SQL查询。建议使用RAM用户提升安全性,并根据需要配置时区和公网访问权限。具体步骤和注意事项请参考阿里云官方文档。
|
1月前
|
存储 机器学习/深度学习 分布式计算
大数据技术——解锁数据的力量,引领未来趋势
【10月更文挑战第5天】大数据技术——解锁数据的力量,引领未来趋势
|
10天前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
84 7
下一篇
无影云桌面