电商项目之建模分析(8个问题)|学习笔记

本文涉及的产品
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
简介: 快速学习电商项目之建模分析(8个问题)

开发者学堂课程【新电商大数据平台2020最新课程:电商项目之建模分析(8个问题)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/640/detail/10495


电商项目之建模分析(8个问题)

 

本节主要讲建模分析的8个问题及其解决方向

image.png

问题1:临时取数需求占用数仓人员大部分时间

在正常开发工作当中,可能会提出一些临时需求,比如产品经理会根据客户需求提出一些相关需求,临时需求产生之后,需要有人去做,这样开发人员的大部分时间会被占用,因此就会无法完成自己的工作。

解决方向:自动取数和 OLAP 系统

系统需要提前做出来,为后面的客户需求提供一个数据支持,减少临时需求的产生,节省开发人员的时间。

问题2:数仓规范和流程不一致,跨部门合作

比如,如果规则流程不清晰,之后进行开发就会遇到很多问题,导致后续一些开发人员无法进行正常对接。

跨部门合作,比如,做大数据的工作人员可能会和测试组或者后端开发组进行交物,这时各部门所负责的工作对方都不懂,就可以各自去学习相关的开发文档或规范文档。

解决方向:建模规范和开发规范

问题3:指标口径不一致导致数据可信度下降

比如,运行一个数据执行两次任务的时候,结果可能不一致,首先要分析数据,检查是否丢失数据。两次结果不相同,可能是数据有问题,也可能是计算引擎有问题。

解决方向:指标字典

问题4:数据膨胀导致计算资源紧张,出数时间得不到保障

比如,在电商行业,某一个时间点数据量非常大,这时预估资源可能会不够,计算资源有限,导致任务运行效率降低,运行时间拖长,出数时间得不到保障。所以,我们在开发文档建模过程中,需要把预估资源合理利用好。

解决方向:建模规范和开发规范

数据产品和服务化(后面会说到数据产品和服务化的具体意思)

问题5:问题排查和异常数据处理时间过长

比如产生一个异常之后,我们可能会花大量的精力和时间去解决这个问题,这时开发时间就会减少。我们可以通过原数据的管理和数据的质量监控来去监控这些问题。

解决方向:元数据与数据质量监控(不是解决问题的办法而是进行数据的侦查,分析问题产生的地方,之后再解决问题)

问题6:数据安全和数据共享矛盾不可调和

比如用户的基本信息数据,身份证,手机号等隐私数据我们接触不到。所以要使用的时候,我们需要向组长或者项目经理甚至开发总监申请调用,这时就需要进行一步步审批,审批的步骤可能相当复杂。

后端开发或是大数据开发都必须保证数据安全。

解决办法:数据分级与权限管理

问题7:产出形式单一

比如做开发时,只是简简单单写出一个报表,没有特别高的价值,而且任务比较单一化。如果后续,有一些画像或推荐系统等做数据支持,就会更有意义。

解决方向:数据产品和服务化

问题8:业务需求响应不及时

与数据膨胀导致计算资源紧张类似,比如在开发时,我们定义好某个任务要跑多久,之前 UM2跑的时候可能没什么问题,但是数据量一增大, UM2的性能大大降低,这时可能需要用到 spark 去跑,来提高效率,在规定时间内完成任务,所以我们需要设计一些备选方案。

解决办法:自动取数和 OLAP 系统

数据产品和服务化

相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
存储 SQL 机器学习/深度学习
用户画像标签体系——从零开始搭建实时用户画像(三)
用户画像标签体系——从零开始搭建实时用户画像(三)
2452 0
用户画像标签体系——从零开始搭建实时用户画像(三)
|
10月前
|
搜索推荐 NoSQL Redis
149 混合推荐系统案例(功能分析)
149 混合推荐系统案例(功能分析)
76 0
|
存储 数据采集 自然语言处理
知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等
知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等
知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等
|
4月前
|
机器学习/深度学习 算法 数据挖掘
【数据挖掘】关联模式评估方法及Apriori算法超市购物应用实战(超详细 附源码)
【数据挖掘】关联模式评估方法及Apriori算法超市购物应用实战(超详细 附源码)
147 0
|
10月前
|
搜索推荐 算法
148 混合推荐系统案例(需求分析)
148 混合推荐系统案例(需求分析)
94 0
|
SQL 数据采集 搜索推荐
开源大数据分析实验(4)——简单用户画像分析之数据可视化展现
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
|
自然语言处理 算法 NoSQL
手把手教学小型金融知识图谱构建:量化分析、图数据库neo4j、图算法、关系预测、命名实体识别、Cypher Cheetsheet详细教学等
手把手教学小型金融知识图谱构建:量化分析、图数据库neo4j、图算法、关系预测、命名实体识别、Cypher Cheetsheet详细教学等
手把手教学小型金融知识图谱构建:量化分析、图数据库neo4j、图算法、关系预测、命名实体识别、Cypher Cheetsheet详细教学等
|
存储 人工智能 数据可视化
手把手教学构建证券知识图谱/知识库(含码源):网页获取信息、设计图谱、Cypher查询、Neo4j关系可视化展示
手把手教学构建证券知识图谱/知识库(含码源):网页获取信息、设计图谱、Cypher查询、Neo4j关系可视化展示
手把手教学构建证券知识图谱/知识库(含码源):网页获取信息、设计图谱、Cypher查询、Neo4j关系可视化展示
|
SQL 存储 数据挖掘
ChatGPT 数据仓库实战:Kaggle 酒店入住数据分析与维度建模
ChatGPT 数据仓库实战:Kaggle 酒店入住数据分析与维度建模
|
数据采集 监控 数据挖掘
电商项目之数据清洗详解|学习笔记
快速学习电商项目之数据清洗详解