方案_我们能学到什么|学习笔记

简介: 快速学习方案_我们能学到什么

开发者学堂课程【2020版大数据实战项目之DMP广告系统(第四阶段)方案_我们能学到什么】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/679/detail/11795


方案_我们能学到什么


DMP 的主要任务

image.png

这节课主要讲 DMP 项目当中,主要能学到什么,以及整个编写代码的流程应该是怎么样的。这些内容都在 idea 工程当中去实现,其实也就是刚才所说三个工程当中的第一个工程,在这个工程当中,既要做 ETL ,把数据落地到 ODS ,要去 ODS 当中补取那张表,去统计广告类的各种报表,对数据进行标签化。但是标签化要用到商圈库这个功能,标签化和商圈库最终要进行标签合并和统一用户识别。

标签合并是假如说现在有了一类标签,又生成了一类标签,这两类标签是否合并,这是一个问题。如果数据集当中,多条数据对应对应一个用户,怎么摘出来其中关系,怎么去进行统一用户的判定,哪一条数据属于哪一个用户因为标识会有不同。这些事情做完,要进行标签衰减,历史合并,客户识别,合并。这些功能虽然很多,其实是在一个文件里做的,并不算特别复杂。

在整个项目当中,能学到比较大知识点。第一大知识点,报表生成,包括如何报表,数据组织。第二大知识点,如何进行标签法,如何使用 spark 进行相对较为复杂的数据处理和合并,此操作比较复杂。

相关文章
|
2月前
|
弹性计算 应用服务中间件 持续交付
阿里云应用方案
为拥有传统单体和微服务架构混合的电商企业提供阿里云应用方案。该方案利用阿里云服务器迁移中心(SMC)实现IDC服务器到ECS的快速自动迁移,并通过云效建立自动化部署流水线。微服务应用则采用企业级分布式应用服务EDAS进行无缝迁移。数据迁移方面,实施多租户隔离与统一管理规范,确保数据迁移的安全性与合规性。此方案旨在帮助企业平滑迁移上云,优化资源管理,加速业务响应,并保障数据安全与业务连续性,助力数字化转型。
|
3月前
|
缓存 前端开发 NoSQL
设计与实现个人博客系统的技术架构与最佳实践
设计与实现个人博客系统的技术架构与最佳实践
|
5月前
|
移动开发 HTML5
小气泡功能在中的两种实现方案
小气泡功能在中的两种实现方案
45 0
小气泡功能在中的两种实现方案
|
Prometheus 监控 Cloud Native
【分布式技术专题】「架构实践于案例分析」盘点一下分布式模式下的服务治理和监控优化方案
【分布式技术专题】「架构实践于案例分析」盘点一下分布式模式下的服务治理和监控优化方案
238 0
【分布式技术专题】「架构实践于案例分析」盘点一下分布式模式下的服务治理和监控优化方案
|
数据可视化 数据挖掘 大数据
方案_技术方案|学习笔记
快速学习方案_技术方案
165 0
方案_技术方案|学习笔记
|
SQL 前端开发 JavaScript
6款 Retool 最佳替代方案
本篇文章的目的通过低代码平台使用者的视角引出细节,了解他们为什么使用低代码平台以及会选择哪个低代码平台来加速内部系统的开发。
787 0
6款 Retool 最佳替代方案
|
缓存 前端开发 Serverless
人人都是Serverless架构师之传统内容管理系统改造实战三[性能优化]
内容管理系统是很常见的一种web应用场景,可以用到个人独立站,企业官网展示等场景,具有很高的实用价值,一个标准的内容管理系统主要由三个部分组成 主站展示部分、后台管理系统、API接口服务,本系列文章会以一个已有内容管理系统的Serverless架构重构展开,介绍改造的基本思路,改造细节,以及性能优化业务可观测设计等。涉及大家关心的Serverless生产遇到的一些问题,比如数据库、日志、动静态分离、调试、维护、灰度方案等。最真实的展现Serverless架构的实施落地细节。
358 0
人人都是Serverless架构师之传统内容管理系统改造实战三[性能优化]
|
存储 Java 网络性能优化
分布式设计要点 | 学习笔记
快速学习分布式设计要点
130 0
|
前端开发 开发者 容器
总结适配方案|学习笔记
快速学习 总结适配方案
|
SQL 监控 网络协议
云架构系统如何做性能分析?| 实战干货
云架构系统如何做性能分析?| 实战干货
下一篇
无影云桌面