基于DataWorks的企业订单数据上云实现数据可视化实践

本文涉及的产品
大数据开发治理平台DataWorks,Serverless资源组抵扣包300CU*H
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 基于DataWorks的企业订单数据上云实现数据可视化实践

实验内容:

本实验的数据来自一家大型的石油气配送企业,业务区域涵盖湖北省内大部分城市。

每日的销售额大概在200万,产生数万条销售数据,订单类型主要是13公斤,50公斤,5公斤的石油气销售数据。

本次实验主要实现以下2个功能:

  1. 使用柱状图显示湖北省各城市的销售额;

  2. 使用饼状图显示各分类产品下的订单总金额。


实验思路:

  1. 进入DataWorks上传从MySQL数据导出的CSV文件;

  2. 通过DataWorks对结果数据进行渲染实现数据可视化展示。


实验目的:

1、 掌握使用DataWorks的数据上传功能

2、 掌握使用SQL查询筛选数据的功能

3、 掌握DataWorks的数据可视化中柱状图,条形图,饼形图的使用方法

4、 掌握DataWorks的电子表格的使用方法


实验步骤:

下载CSV文件(模拟本地文件)

https://university-labfileapp.oss-cn-hangzhou.aliyuncs.com/%E5%AE%8F%E9%B9%8F--%E5%A4%A7%E6%95%B0%E6%8D%AEACA/orderutf8.csv

进入到DataWorks工作空间(具体进入方式见https://developer.aliyun.com/article/1341783?spm=a2c6h.13148508.setting.15.25274f0eQ8JVET)

进入上传数据页面

image.png

点击【提交】按钮上传数据

image.png

把数据集添加到MaxCompute

image.png

添加成功

image.png

右键点击【order】表名并选择【生产SQL】会默认生成SQL代码,选中SQL语句,点击左侧的运行图标可以运行SQL

image.png

image.png

在下方出现查询出的结果数据

image.png


筛选各城市的总销售额

通过SQL筛选出各个城市的总销售额,例如分别统计出襄阳市,十堰市,武汉市等城市的对应的每个城市的总销售额

SELECT  a.city,(select SUM(price)  
                from u_tlck91ct_1669278366.order 
                where city = a.city) as totalprice
FROM    u_tlck91ct_1669278366.order as a 
where a.city != '' 
GROUP by a.city
LIMIT   200
;

image.png

对结果进行排序,再按销售额从大到小排列

SELECT  a.city, (select SUM(price) 
                  from u_tlck91ct_1669278366.order 
                   where city = a.city)   as totalprice
FROM    u_tlck91ct_1669278366.order as a                 
where a.city != '' 
GROUP by a.city 
ORDER  by totalprice DESC
LIMIT   200;

image.png

使用DataWorks的柱状图组件来渲染SQL返回数据

image.png

点击【分组柱状图】

image.png


使用饼状图显示各分类产品下的订单金额

使用饼状图显示各分类产品下的下单总金额,需要先使用SQL筛选出响应的数据。

SELECT  a.type,(select SUM(price) 
                from u_tlck91ct_1669278366.order 
                where type = a.type) as totalprice
FROM    u_tlck91ct_1669278366.order as a 
where a.city != ''  
GROUP by a.type 
ORDER  by totalprice DESC 
LIMIT   10000 
;

image.png

使用饼形图对SQL查询返回的数据进行渲染,可以很直观查看订单结果,以及对数据进行比对。

image.png


实验总结:

通过本次实验将石油气配送公司的订单数据上传至云端,并对数据进行了SQL查询筛选,最后通过数据可视化组件进行渲染。

我们可以学到如果使用SQL对数据进行筛选得到我们想要的结果,其中包括了SQL的SELECT(查询)、GROUP BY(分组去重)、ORDER BY(排序)、AS(结果赋值)。

这些SQL语法在以后的实际项目中经常被用到,大家可以多多练习。

通过对SQL查询返回的数据进行数据可视化处理,我们体验到了DataWorks的数据可视化的强大功能,将繁琐、枯燥无味的数据用图形组件展示,可以很直观的查看数据结果,并对结果进行比对。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
相关文章
|
3月前
|
数据采集 存储 分布式计算
构建智能数据湖:DataWorks助力企业实现数据驱动转型
【8月更文第25天】本文将详细介绍如何利用阿里巴巴云的DataWorks平台构建一个智能、灵活、可扩展的数据湖存储体系,以帮助企业实现数据驱动的业务转型。我们将通过具体的案例和技术实践来展示DataWorks如何集成各种数据源,并通过数据湖进行高级分析和挖掘,最终基于数据洞察驱动业务增长和创新。
250 53
|
6月前
|
SQL 运维 DataWorks
Flink CDC在阿里云DataWorks数据集成应用实践
本文整理自阿里云 DataWorks 数据集成团队的高级技术专家 王明亚(云时)老师在 Flink Forward Asia 2023 中数据集成专场的分享。
1420 2
Flink CDC在阿里云DataWorks数据集成应用实践
|
SQL 数据采集 分布式计算
基于DataWorks+MaxCompute的公共电影票房数据预处理实践
本次实验对春节档每日票房的数据进行预处理,主要是数据清洗(例如空值过滤,条件筛选),数据转换(例如含有相同属性的两条数据合并为一条数据)。通过本次实验让大家掌握阿里云大数据产品DataWorks及MaxCompute的基本使用。
|
6月前
|
DataWorks 监控 数据可视化
|
SQL DataWorks NoSQL
阿里云DataWorks的数据服务可以帮助企业统一管理对内对外的API服务
阿里云DataWorks的数据服务可以帮助企业统一管理对内对外的API服务
219 2
|
SQL 存储 分布式计算
基于MaxCompute+DataWorks离线同步某电商用户购买记录实践
本次实验使用DataWorks的DDL模式新建数据表,然后将保存在本地的某用户购买记录同步到MaxCompute数仓中,本实验采用的是增量数据同步,每次同步过来的数据会直接存储在MaxCompute中,不会覆盖之前的数据。
|
SQL 分布式计算 DataWorks
基于DataWorks+MaxCompute的企业本地数据上云实践
基于DataWorks+MaxCompute的企业本地数据上云实践
|
存储 数据采集 DataWorks
2万字揭秘阿里巴巴数据治理平台DataWorks建设实践
阿里巴巴一直将数据作为自己的核心资产与能力之一,从最早的淘宝、天猫等电商业务,到后续的优酷、高德、菜鸟等板块,DataWorks、MaxCompute、Hologres等产品用一套技术体系来支持不同业务的发展与创新,为企业带来整体的“数据繁荣”。 数据繁荣为我们带来了红利,同时也带动了各类数据治理需求的井喷,特别是降本等需求的不断出现,阿里云DataWorks团队将13年的产品建设经验整理成最佳实践,从数据生产规范性治理、数据生产稳定性治理、数据生产质量治理、数据应用提效治理、数据安全管控治理、数据成本治理、数据治理组织架构及文化建设等7个方面为大家揭秘数据治理平台建设实践
27918 11
2万字揭秘阿里巴巴数据治理平台DataWorks建设实践
|
3月前
|
DataWorks Kubernetes 大数据
飞天大数据平台产品问题之DataWorks提供的商业化服务如何解决
飞天大数据平台产品问题之DataWorks提供的商业化服务如何解决
|
3月前
|
SQL DataWorks 安全
DataWorks产品使用合集之如何实现分钟级调度
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
下一篇
无影云桌面