基于DataWorks的企业订单数据上云实现数据可视化实践

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
大数据开发治理平台DataWorks,资源组抵扣包 750CU*H
简介: 基于DataWorks的企业订单数据上云实现数据可视化实践

实验内容:

本实验的数据来自一家大型的石油气配送企业,业务区域涵盖湖北省内大部分城市。

每日的销售额大概在200万,产生数万条销售数据,订单类型主要是13公斤,50公斤,5公斤的石油气销售数据。

本次实验主要实现以下2个功能:

  1. 使用柱状图显示湖北省各城市的销售额;

  2. 使用饼状图显示各分类产品下的订单总金额。


实验思路:

  1. 进入DataWorks上传从MySQL数据导出的CSV文件;

  2. 通过DataWorks对结果数据进行渲染实现数据可视化展示。


实验目的:

1、 掌握使用DataWorks的数据上传功能

2、 掌握使用SQL查询筛选数据的功能

3、 掌握DataWorks的数据可视化中柱状图,条形图,饼形图的使用方法

4、 掌握DataWorks的电子表格的使用方法


实验步骤:

下载CSV文件(模拟本地文件)

https://university-labfileapp.oss-cn-hangzhou.aliyuncs.com/%E5%AE%8F%E9%B9%8F--%E5%A4%A7%E6%95%B0%E6%8D%AEACA/orderutf8.csv

进入到DataWorks工作空间(具体进入方式见https://developer.aliyun.com/article/1341783?spm=a2c6h.13148508.setting.15.25274f0eQ8JVET)

进入上传数据页面

image.png

点击【提交】按钮上传数据

image.png

把数据集添加到MaxCompute

image.png

添加成功

image.png

右键点击【order】表名并选择【生产SQL】会默认生成SQL代码,选中SQL语句,点击左侧的运行图标可以运行SQL

image.png

image.png

在下方出现查询出的结果数据

image.png


筛选各城市的总销售额

通过SQL筛选出各个城市的总销售额,例如分别统计出襄阳市,十堰市,武汉市等城市的对应的每个城市的总销售额

SELECT  a.city,(select SUM(price)  
                from u_tlck91ct_1669278366.order 
                where city = a.city) as totalprice
FROM    u_tlck91ct_1669278366.order as a 
where a.city != '' 
GROUP by a.city
LIMIT   200
;

image.png

对结果进行排序,再按销售额从大到小排列

SELECT  a.city, (select SUM(price) 
                  from u_tlck91ct_1669278366.order 
                   where city = a.city)   as totalprice
FROM    u_tlck91ct_1669278366.order as a                 
where a.city != '' 
GROUP by a.city 
ORDER  by totalprice DESC
LIMIT   200;

image.png

使用DataWorks的柱状图组件来渲染SQL返回数据

image.png

点击【分组柱状图】

image.png


使用饼状图显示各分类产品下的订单金额

使用饼状图显示各分类产品下的下单总金额,需要先使用SQL筛选出响应的数据。

SELECT  a.type,(select SUM(price) 
                from u_tlck91ct_1669278366.order 
                where type = a.type) as totalprice
FROM    u_tlck91ct_1669278366.order as a 
where a.city != ''  
GROUP by a.type 
ORDER  by totalprice DESC 
LIMIT   10000 
;

image.png

使用饼形图对SQL查询返回的数据进行渲染,可以很直观查看订单结果,以及对数据进行比对。

image.png


实验总结:

通过本次实验将石油气配送公司的订单数据上传至云端,并对数据进行了SQL查询筛选,最后通过数据可视化组件进行渲染。

我们可以学到如果使用SQL对数据进行筛选得到我们想要的结果,其中包括了SQL的SELECT(查询)、GROUP BY(分组去重)、ORDER BY(排序)、AS(结果赋值)。

这些SQL语法在以后的实际项目中经常被用到,大家可以多多练习。

通过对SQL查询返回的数据进行数据可视化处理,我们体验到了DataWorks的数据可视化的强大功能,将繁琐、枯燥无味的数据用图形组件展示,可以很直观的查看数据结果,并对结果进行比对。

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
9月前
|
SQL 分布式计算 DataWorks
活动实践 | DataWorks智能交互式数据开发与分析之旅
本指南介绍了如何使用阿里云平台进行大数据开发与分析。首先,在MaxCompute控制台创建项目并配置计算资源;接着,通过DataWorks控制台创建工作空间和独享资源组,并绑定工作空间。然后,创建个人开发环境,载入案例并新建Notebook实例。在Notebook中,通过SQL和Python Cell进行交互式开发和数据分析,体验智能助手Copilot的功能,如SQL改写、解释、生成注释及智能建表。最后,清理所有创建的资源,包括删除DataWorks资源、MaxCompute项目及网络配置,确保环境整洁。
|
7月前
|
SQL 弹性计算 DataWorks
Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践
Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践
315 6
|
9月前
|
分布式计算 DataWorks 大数据
🚀DataWorks 深度实践与评测:数据治理新时代的全景体验。
在数字化转型中,企业不仅需要技术创新,更需完善的**数据管理和开发治理工具**。DataWorks 作为阿里云推出的一站式智能大数据平台,整合了阿里巴巴15年的大数据经验,提供从数据接入、开发、治理到资产管理的全流程解决方案。它支持湖仓一体架构,内置AI助手提升开发效率,并适用于金融、零售等多行业。本文将深入探讨 DataWorks 的功能、应用场景及性能表现,通过用户画像分析实践展示其强大潜力...
524 8
🚀DataWorks 深度实践与评测:数据治理新时代的全景体验。
|
10月前
|
DataWorks 数据挖掘 大数据
方案实践测评 | DataWorks集成Hologres构建一站式高性能的OLAP数据分析
DataWorks在任务开发便捷性、任务运行速度、产品使用门槛等方面都表现出色。在数据处理场景方面仍有改进和扩展的空间,通过引入更多的智能技术、扩展数据源支持、优化任务调度和可视化功能以及提升团队协作效率,DataWorks将能够为企业提供更全面、更高效的数据处理解决方案。
|
10月前
|
SQL 数据采集 DataWorks
DataWorks产品最佳实践测评:用户画像分析实践
DataWorks作为阿里云提供的一款大数据开发治理平台,以其强大的数据处理能力和便捷的操作界面,在数据处理领域扮演着重要角色。本文将基于个人体验,对DataWorks产品进行最佳实践测评,重点探讨用户画像分析实践,并提出优化建议。
208 11
|
10月前
|
SQL 数据采集 DataWorks
基于DataWorks的多场景实践及数据开发Data Studio最新体验测评
DataWorks是阿里云推出的一站式智能大数据开发治理平台,自2009年发布以来,历经多次迭代,成为企业数字化转型的重要工具。本文通过多个实践案例,如公共电影票房数据预处理,展示了DataWorks如何帮助企业高效处理大数据,涵盖数据集成、ETL开发、数据分析及治理等全流程。最新版DataWorks引入了智能助手Copilot,进一步提升了用户体验和工作效率。
|
10月前
|
数据采集 DataWorks 搜索推荐
DataWorks产品最佳实践测评:用户画像分析实践
DataWorks产品最佳实践测评:用户画像分析实践
344 3
|
数据采集 存储 分布式计算
构建智能数据湖:DataWorks助力企业实现数据驱动转型
【8月更文第25天】本文将详细介绍如何利用阿里巴巴云的DataWorks平台构建一个智能、灵活、可扩展的数据湖存储体系,以帮助企业实现数据驱动的业务转型。我们将通过具体的案例和技术实践来展示DataWorks如何集成各种数据源,并通过数据湖进行高级分析和挖掘,最终基于数据洞察驱动业务增长和创新。
645 53
|
SQL 运维 DataWorks
Flink CDC在阿里云DataWorks数据集成应用实践
本文整理自阿里云 DataWorks 数据集成团队的高级技术专家 王明亚(云时)老师在 Flink Forward Asia 2023 中数据集成专场的分享。
1699 2
Flink CDC在阿里云DataWorks数据集成应用实践
|
DataWorks 监控 数据可视化

热门文章

最新文章