电商项目之建模分析(8个问题)|学习笔记

本文涉及的产品
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
简介: 快速学习电商项目之建模分析(8个问题)

开发者学堂课程【新电商大数据平台2020最新课程:电商项目之建模分析(8个问题)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/640/detail/10495


电商项目之建模分析(8个问题)

 

本节主要讲建模分析的8个问题及其解决方向

image.png

问题1:临时取数需求占用数仓人员大部分时间

在正常开发工作当中,可能会提出一些临时需求,比如产品经理会根据客户需求提出一些相关需求,临时需求产生之后,需要有人去做,这样开发人员的大部分时间会被占用,因此就会无法完成自己的工作。

解决方向:自动取数和 OLAP 系统

系统需要提前做出来,为后面的客户需求提供一个数据支持,减少临时需求的产生,节省开发人员的时间。

问题2:数仓规范和流程不一致,跨部门合作

比如,如果规则流程不清晰,之后进行开发就会遇到很多问题,导致后续一些开发人员无法进行正常对接。

跨部门合作,比如,做大数据的工作人员可能会和测试组或者后端开发组进行交物,这时各部门所负责的工作对方都不懂,就可以各自去学习相关的开发文档或规范文档。

解决方向:建模规范和开发规范

问题3:指标口径不一致导致数据可信度下降

比如,运行一个数据执行两次任务的时候,结果可能不一致,首先要分析数据,检查是否丢失数据。两次结果不相同,可能是数据有问题,也可能是计算引擎有问题。

解决方向:指标字典

问题4:数据膨胀导致计算资源紧张,出数时间得不到保障

比如,在电商行业,某一个时间点数据量非常大,这时预估资源可能会不够,计算资源有限,导致任务运行效率降低,运行时间拖长,出数时间得不到保障。所以,我们在开发文档建模过程中,需要把预估资源合理利用好。

解决方向:建模规范和开发规范

数据产品和服务化(后面会说到数据产品和服务化的具体意思)

问题5:问题排查和异常数据处理时间过长

比如产生一个异常之后,我们可能会花大量的精力和时间去解决这个问题,这时开发时间就会减少。我们可以通过原数据的管理和数据的质量监控来去监控这些问题。

解决方向:元数据与数据质量监控(不是解决问题的办法而是进行数据的侦查,分析问题产生的地方,之后再解决问题)

问题6:数据安全和数据共享矛盾不可调和

比如用户的基本信息数据,身份证,手机号等隐私数据我们接触不到。所以要使用的时候,我们需要向组长或者项目经理甚至开发总监申请调用,这时就需要进行一步步审批,审批的步骤可能相当复杂。

后端开发或是大数据开发都必须保证数据安全。

解决办法:数据分级与权限管理

问题7:产出形式单一

比如做开发时,只是简简单单写出一个报表,没有特别高的价值,而且任务比较单一化。如果后续,有一些画像或推荐系统等做数据支持,就会更有意义。

解决方向:数据产品和服务化

问题8:业务需求响应不及时

与数据膨胀导致计算资源紧张类似,比如在开发时,我们定义好某个任务要跑多久,之前 UM2跑的时候可能没什么问题,但是数据量一增大, UM2的性能大大降低,这时可能需要用到 spark 去跑,来提高效率,在规定时间内完成任务,所以我们需要设计一些备选方案。

解决办法:自动取数和 OLAP 系统

数据产品和服务化

相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
数据采集 分布式计算 编译器
利用Pholcus框架提取小红书数据的案例分析
利用Pholcus框架提取小红书数据的案例分析
|
5月前
|
SQL 数据采集 算法
【电商数据分析利器】SQL实战项目大揭秘:手把手教你构建用户行为分析系统,从数据建模到精准营销的全方位指南!
【8月更文挑战第31天】随着电商行业的快速发展,用户行为分析的重要性日益凸显。本实战项目将指导你使用 SQL 构建电商平台用户行为分析系统,涵盖数据建模、采集、处理与分析等环节。文章详细介绍了数据库设计、测试数据插入及多种行为分析方法,如购买频次统计、商品销售排名、用户活跃时间段分析和留存率计算,帮助电商企业深入了解用户行为并优化业务策略。通过这些步骤,你将掌握利用 SQL 进行大数据分析的关键技术。
267 0
|
搜索推荐 NoSQL Redis
149 混合推荐系统案例(功能分析)
149 混合推荐系统案例(功能分析)
95 0
|
8月前
|
存储 数据可视化 数据挖掘
【数据分析与可视化】时间序列基础讲解与实战(图文解释 附源码)
【数据分析与可视化】时间序列基础讲解与实战(图文解释 附源码)
86 0
|
机器学习/深度学习 数据采集 人工智能
机器学习实战 | 综合项目-电商销量预估进阶方案
本篇内容是Kaggle数据科学竞赛Rossmann store sales解决方案的进阶版本,整体方案包括探索性数据分析、缺失值处理、特征工程、基准模型与评估、XGBoost建模与调优等完整板块。
4221 1
机器学习实战 | 综合项目-电商销量预估进阶方案
|
存储 人工智能 数据可视化
手把手教学构建证券知识图谱/知识库(含码源):网页获取信息、设计图谱、Cypher查询、Neo4j关系可视化展示
手把手教学构建证券知识图谱/知识库(含码源):网页获取信息、设计图谱、Cypher查询、Neo4j关系可视化展示
手把手教学构建证券知识图谱/知识库(含码源):网页获取信息、设计图谱、Cypher查询、Neo4j关系可视化展示
|
数据采集 机器学习/深度学习 监控
【数据挖掘实战】——电力窃漏电用户自动识别
【数据挖掘实战】——电力窃漏电用户自动识别
1643 0
【数据挖掘实战】——电力窃漏电用户自动识别
|
数据采集 数据可视化 数据挖掘
数据分析案例-旅游景点票价预测
数据分析案例-旅游景点票价预测
333 0
数据分析案例-旅游景点票价预测
|
数据采集 SQL 分布式计算
实践:搭建电商推荐系统|学习笔记
快速学习实践:搭建电商推荐系统
565 0
实践:搭建电商推荐系统|学习笔记
|
数据挖掘
一文速览-数据分析基础以及常规流程
一文速览-数据分析基础以及常规流程
131 0
一文速览-数据分析基础以及常规流程