零售行业数据分析工作模式革新

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,5000CU*H 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: 在零售行业,干数据分析和汇报的小伙伴肯定懂,每个月、每季度、每年都要做各种报告往上交。随着公司业务的拓展,销售的类目从几种到几十种,甚至到上百种,数据量也不断往上涨。以前做个Excel表、画几张图就能搞定的事情,现在光是整理这些数据就够让人头疼了,更别说还要从中找出有用的信息,做成清晰易懂的报告。因为,面对这么庞大的数据量,我们真是遇到了前所未有的挑战。DataV Note作为一个智能分析文档,解决了我们的困境。

在零售行业,干数据分析和汇报的小伙伴肯定懂,每个月、每季度、每年都要做各种报告往上交。随着公司业务的拓展,销售的类目从几种到几十种,甚至到上百种,数据量也不断往上涨。以前做个Excel表、画几张图就能搞定的事情,现在光是整理这些数据就够让人头疼了,更别说还要从中找出有用的信息,做成清晰易懂的报告。

因为,面对这么庞大的数据量,我们真是遇到了前所未有的挑战。我们在业界内也寻找一些解决方案来解决我们的问题,顺便给大家分享一下。

image.png

一、面临的挑战

(1)工作模式

提需求 -> BI技术人员导出Excel -> Excel中数据处理 -> Excel画图 -> 复制进去PPT做报告

  • Excel中简单数据处理

image.png

  • 画图 & 做报告

image.png

(2)挑战

  • 跨部门合作:业务部门需要给BI技术部门频繁提需求沟通,才能得到需要的数据
  • 跨工具使用:DBA工具取数、Excel数据加工、Excel画图、Word或PPT做报告
  • 无法复用:每月、每季度、每年的分析报告基本雷同,只是数据不一致,但每次都需要重新做
  • 无法数字化沉淀:都是保存在本地的Excel、PPT、Word文档,人员交替后存在丢失风险
  • 数据量大:数据量大时,Excel处理起来会卡顿

二、新模式的探索和落地

为了应对以上的挑战,我们寻找一款可协同、多模态的数字化产品,并且有一定的AI辅助能力。所幸的是我们找到了一款阿里云下比较贴近的产品(DataV Note),他是一款智能文档工具,支持写代码、画图、写报告的功能。

(1)跨部门合作

  • 写需求:我们会创建一个文本单元格,写下需求
  • BI取数:BI技术人员会根据需求在下面取数

image.png

  • 画图:根据取数所得的数据集画图

image.png

(2)统一工具链

在编辑态中,DataV Note的文档中提供了SQL、Python、图表、地图、富文本、Marddown的单元格,能满足取数、画图、写文字报告的需求。

image.png

在预览态中,DataV Note支持对布局、主题、水印等等的设置,能讲报告美化润色。

image.png

(3)数字化建设

我们将每个月、每个季度、每年的报告整理好:

image.png

当编写新报告时,只需要复制出来替换里面的数据集即可,当然需要更改里面的结论:

image.png

image.png

由于统一了工具链以及进行数字化建设,这让我们把以前散乱的Word、PPT、Excel沉淀下来,哪怕是公司人员交替,这些分析的思路和模板都保留下来,成为公司宝贵的知识库之一。

(4)数据量问题

我们季度、年度的销售信息大概会有数十万条、甚至上百万条,DataV Note还是能快速查询出来,还是可以符合预期的。

三、未来的期待

我们使用下来DataV Note还是很赞的,但是还有提升的空间。我们描述下未来的分析愿景:

  • 定时分析:希望能支持上定时调度自动进行分析任务
  • AI增强:希望能通过数据清洗、数据去重、数据插值、数据异常值处理等等手段进行每个季度自动分析,并通知到我们
  • 大模型切换:最近DeepSeek很火,希望能在千问、DeepSeek自定义切换
  • 外网搜索:我们还希望对一些竞对进行分析对比
相关实践学习
DataV Board用户界面概览
本实验带领用户熟悉DataV Board这款可视化产品的用户界面
阿里云实时数仓实战 - 项目介绍及架构设计
课程简介 1)学习搭建一个数据仓库的过程,理解数据在整个数仓架构的从采集、存储、计算、输出、展示的整个业务流程。 2)整个数仓体系完全搭建在阿里云架构上,理解并学会运用各个服务组件,了解各个组件之间如何配合联动。 3 )前置知识要求   课程大纲 第一章 了解数据仓库概念 初步了解数据仓库是干什么的 第二章 按照企业开发的标准去搭建一个数据仓库 数据仓库的需求是什么 架构 怎么选型怎么购买服务器 第三章 数据生成模块 用户形成数据的一个准备 按照企业的标准,准备了十一张用户行为表 方便使用 第四章 采集模块的搭建 购买阿里云服务器 安装 JDK 安装 Flume 第五章 用户行为数据仓库 严格按照企业的标准开发 第六章 搭建业务数仓理论基础和对表的分类同步 第七章 业务数仓的搭建  业务行为数仓效果图  
相关文章
|
1月前
|
SQL 人工智能 数据可视化
数据团队必读:智能数据分析文档(DataV Note)五种高效工作模式
数据项目复杂,涉及代码、数据、运行环境等多部分。随着AI发展,数据科学团队面临挑战。协作式数据文档(如阿里云DataV Note)成为提升效率的关键工具。它支持跨角色协同、异构数据处理、多语言分析及高效沟通,帮助创建知识库,实现可重现的数据科学过程,并通过一键分享报告促进数据驱动决策。未来,大模型AI将进一步增强其功能,如智能绘图、总结探索、NLP2SQL/Python和AutoReport,为数据分析带来更多可能。
91 21
|
数据挖掘 供应链 数据库
|
7月前
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
120 2
|
7月前
|
机器学习/深度学习 数据采集 数据可视化
基于爬虫和机器学习的招聘数据分析与可视化系统,python django框架,前端bootstrap,机器学习有八种带有可视化大屏和后台
本文介绍了一个基于Python Django框架和Bootstrap前端技术,集成了机器学习算法和数据可视化的招聘数据分析与可视化系统,该系统通过爬虫技术获取职位信息,并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析,提供了一个直观的可视化大屏和后台管理系统,以优化招聘策略并提升决策质量。
354 4
|
7月前
|
机器学习/深度学习 算法 数据挖掘
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析
本文介绍了2023年第二届钉钉杯大学生大数据挑战赛初赛A题的Python代码分析,涉及智能手机用户监测数据分析中的聚类分析和APP使用情况的分类与回归问题。
133 0
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析