【实验】阿里云大数据助理工程师认证(ACA)- QuickBI报表制作(上)

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
智能商业分析 Quick BI,专业版 50license 1个月
简介: 【实验】阿里云大数据助理工程师认证(ACA)- QuickBI报表制作

实验概述

ABC公司是一家网上书城,用户可以通过网站下单订购书籍。为了使公司高层人员更好地了解网上书城的销售情况,需要制作一个销售分析报表。Quick BI能够提供海量数据实时在线分析,拖拽式操作、具有丰富的可视化效果。学生通过本实验将能根据场景独立地制作销售分析报表。


实验目的


能够使用Quick BI制作销售分析报表


了解不同场景下的图表应用


实验架构


阿里云QuickBI


第 1 章:实验背景


1.1 maxcompute


在弹出的左侧栏中,点击 创建资源 按钮,开始创建实验资源。

资源创建过程需要1-3分钟。完成实验资源的创建后,用户可以通过 实验资源 查看实验中所需的资源信息,例如:阿里云账号等


1.2 实验概述


ABC公司是一家网上书城,用户可以通过网站下单订购书籍。为了使公司高层人员更好地了解网上书城的销售情况,需要制作一个销售分析报表。Quick BI能够提供海量数据实时在线分析,拖拽式操作、具有丰富的可视化效果。学生通过本实验将能根据场景独立地制作销售分析报表。


1.3 实验目的


能够使用Quick BI制作销售分析报表
了解不同场景下的图表应用


1.4 实验架构


阿里云QuickBI


1.5 实验准备


本实验需要使用阿里云的Quick BI资源,具体步骤如下:


【注】本实验均在Google Chrome浏览器下测试运行,为了达到最大兼容,推荐使用Windows7以上的操作系统以及Chrome浏览器进行实验。


【注】一旦开始创建资源,该实验就开始计时,并在到达实验规定的时长时,将自动结束实验并清除资源。


进入实验后会出现如下界面,首先点击实验手册,然后点击附件下载,将附件下载到本地


20200711135312888.png

下载完成之后点击实验资源,然后点击创建资源按钮,如下图所示:

等待创建完成。创建完成后出现如下界面,点击复制控制台url的链接,然后使用浏览器的隐身窗口或使用其他浏览器打开

打开之后,将课程相关资源中的子用户名称填写到@的前方,然后点击下一步,如下图所示

输入课程相关资源中提供的子用户密码,然后点击登入

进入控制台的界面后,接下来的实验需要进入Quick BI。单击在管理控制台左侧导航栏的“产品与服务”,找到大数据(数加)下的“Quick BI”,点击它



20200711135404884.png


在主界面上会出现您尚未购买的页面,但是Quick BI提供了一个月的免费试用期。单击标准版30天试用申请,如下图所示:


20200711135430455.png


同意用户协议后即可试用Quick BI,点击进入Quick BI标准版按钮

进入Quick BI开发界面,如下图所示:


20200711135458763.png


第 2 章:实验详情


2.1 不同场景下的图形使用


首先我们练习一下使用Quick BI绘制图表:

  1. 柱图

20200711135537747.png


柱图,又称柱状图,是一种以长方形的长度来表达数值的统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况。适合用于展示二维数据集,其中一个轴表示需要对比的分类维度,另一个轴代表相应的数值,比如:(月份,商品销量),或者展示在一个维度上,多个同质可比的指标的比较,比如:(月份,苹果产量,桃子产量)。

它的优点是①简单直观,很容易根据柱子的长短看出值的大小 ②易于比较各组数据之间的差别,但是它不适合较大数据集的展示。与之相类似的有条形图、直方图、堆积图、百分比堆积图、双Y轴等。

2. 折线图


折线图用于显示数据在一个连续的时间间隔或者时间跨度上的变化,它的特点是反映事物随时间或有序类别而变化的趋势。需要注意的是折线图的数据记录数要大于2,可用于大数据量的趋势比较,但是同一个图上最好不要超过5条折线。它适合随时间具有变化趋势的数据集,适合不同情况下的趋势对比。


饼图

饼图多用于表示不同分类的占比情况,通过弧度大小来对比各种分类。


饼图不适用于多系列的数据,因为随着系列的增多,每个切片就会变小,最后导致大小区分不明显,同时多个饼图之间的数值也不好进行比较。饼图适用于比较一个数据分类上各个模块的大小占比的需求


【注】除了柱图、折线图、饼图外还有散点图、气泡图、漏斗图、雷达图等,本实验就不展开介绍了。


2.2 导入数据


  1. 单击“工作空间”


20200711135627645.png

  1. 导入本地数据

阿里云的Quick BI支持上传本地的Excel或CSV文件。以ABC网上书城的的销售数据为例。该文件可以在云中沙箱的实验附件中可以找到,可以直接单击文件名下载到本地。

依次单击 数据源 -> 上传文件,页面会跳转到添加数据源的界面上。



20200711135648624.png

在添加数据源页面单击“本地EXCEL文件”按钮


20200711135743895.png

单击后跳出上传页面,单击“选择文件”按钮,选择刚才下载的文件(booksales.xlsx)打开,如下所示:

20200711135809339.png


单击“确定”按钮,如下所示:


20200711135829441.png

单击“确定”按钮后,在右上角会出现“信息 导入成功,共69659条记录”,可以在右侧栏查看到“booksales”数据源,如下所示:


20200711135849596.png



单击“创建数据集” 按钮

页面会跳转至创建数据集窗口,确定数据集名称和位置,单击“确定”

20200711135917368.png


页面会跳转至数据集标签下,在“我的数据集”下可查看到刚才创建的“booksales”数据集,如下所示

20200711135936904.png

击“新建仪表板”,将会跳转到仪表板制作界面,如下所示:

20200711135958125.png

2.3 设置布局


销售分析报表的布局如下所示:

20200711140051912.png


20200711140106265.png


当前所处页面,如下所示:

20200711140126198.png


清空画布


点击图形右上方三个点按扭下的删除按钮,清空画布,如下所示:

20200711140208600.png


2. 清除水印


在最右上方的页面设置下的基础设置,可以选择不显示水印,如下所示:


20200711140228579.png

3. 设置布局一

20200711140249459.png

在上方仪表盘中,将鼠标置于区域色彩地图之上,单击色彩地图,如下所示:


20200711140310894.png

4. 设置布局二


20200711140332364.png


单击上方仪表板中的柱图,如下所示:


20200711140350568.png

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
2天前
|
存储 人工智能 数据管理
|
1天前
|
机器学习/深度学习 分布式计算 数据挖掘
MaxFrame 性能评测:阿里云MaxCompute上的分布式Pandas引擎
MaxFrame是一款兼容Pandas API的分布式数据分析工具,基于MaxCompute平台,极大提升了大规模数据处理效率。其核心优势在于结合了Pandas的易用性和MaxCompute的分布式计算能力,无需学习新编程模型即可处理海量数据。性能测试显示,在涉及`groupby`和`merge`等复杂操作时,MaxFrame相比本地Pandas有显著性能提升,最高可达9倍。适用于大规模数据分析、数据清洗、预处理及机器学习特征工程等场景。尽管存在网络延迟和资源消耗等问题,MaxFrame仍是处理TB级甚至PB级数据的理想选择。
19 4
|
9天前
|
SQL DataWorks 数据可视化
阿里云DataWorks评测:大数据开发治理平台的卓越表现
阿里云DataWorks是一款集数据集成、开发、分析与管理于一体的大数据平台,支持多种数据源无缝整合,提供可视化ETL工具和灵活的任务调度机制。其内置的安全体系和丰富的插件生态,确保了数据处理的高效性和安全性。通过实际测试,DataWorks展现了强大的计算能力和稳定性,适用于中小企业快速搭建稳定高效的BI系统。未来,DataWorks将继续优化功能,降低使用门槛,并推出更多灵活的定价方案,助力企业实现数据价值最大化。
|
9天前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
41 2
|
4天前
|
SQL 存储 分布式计算
阿里云 Paimon + MaxCompute 极速体验
Paimon 和 MaxCompute 的对接经历了长期优化,解决了以往性能不足的问题。通过半年紧密合作,双方团队专门提升了 Paimon 在 MaxCompute 上的读写性能。主要改进包括:采用 Arrow 接口减少数据转换开销,内置 Paimon SDK 提升启动速度,实现原生读写能力,减少中间拷贝与转换,显著降低 CPU 开销与延迟。经过双十一实战验证,Paimon 表的读写速度已接近 MaxCompute 内表,远超传统外表。欢迎体验!
|
6月前
|
存储 分布式计算 关系型数据库
实时数仓 Hologres产品使用合集之Hologres quickbi读holo是用的直读还是连接
实时数仓Hologres的基本概念和特点:1.一站式实时数仓引擎:Hologres集成了数据仓库、在线分析处理(OLAP)和在线服务(Serving)能力于一体,适合实时数据分析和决策支持场景。2.兼容PostgreSQL协议:Hologres支持标准SQL(兼容PostgreSQL协议和语法),使得迁移和集成变得简单。3.海量数据处理能力:能够处理PB级数据的多维分析和即席查询,支持高并发低延迟查询。4.实时性:支持数据的实时写入、实时更新和实时分析,满足对数据新鲜度要求高的业务场景。5.与大数据生态集成:与MaxCompute、Flink、DataWorks等阿里云产品深度融合,提供离在线
|
7月前
|
分布式计算 大数据 BI
MaxCompute产品使用合集之MaxCompute项目的数据是否可以被接入到阿里云的Quick BI中
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
4月前
|
数据采集 运维 DataWorks
DataWorks产品使用合集之打开quickbi报表时很慢,该怎么办
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
7月前
|
消息中间件 BI Serverless
消息队列推出serverless版、Quick BI升级至5.0……阿里云近期产品动态汇总
消息队列推出serverless版、Quick BI升级至5.0……阿里云近期产品动态汇总
536 1
|
7月前
|
SQL 机器学习/深度学习 数据可视化
产品至简,大道行宽——Quick BI接入通义千问大模型,引领数据消费新范式
产品至简,大道行宽——Quick BI接入通义千问大模型,引领数据消费新范式
780 0

热门文章

最新文章