广告系统中的大数据处理 | 宋慧庆

简介: 分享者简介:宋慧庆,时趣互动 移动广告架构师 十余年互联网老司机,具有多年互联网广告系统研发经验,负责研发个性化动态创意系统,用户画像标签系统以及大数据治理;对编程语言有浓厚的兴趣。

什么是大数据?

从具备4V(Volume,Velocity,Variety,Value)特征的大量数据中挖掘用户的潜在价值。

63c7d965782db3a886664bfe604290e211b73e6e

75187c916d79ea2a9d2c3aea649bb8c8fa51bbc5

广告系统的数据来源

  • DSP监听数据(主要是ssp,adx渠道)
  • 广告主数据
  • 广告投放过程中收集的数据
  • 购买/通过交换得到的第三方数据
  • 运营商合作数据


精准广告的系统特点

  • 数据量巨大(广告本身的数据,定向数据,用户特征数据,广告展示环境的特征数据)
  • 响应速度要求特别快
  • 实时性要求特别高(广告数据,定向数据,用户特征数据,广告展示环境的特征数据等实时性)
  • 系统可用性要求特别高(柔性降级,可扩展性)


PC广告与移动广告的区别

  • 交互方式的不同
  • 使用位置的不同
  • 用户标识的不同
  • 展现形式的不同
  • 网络环境的不同
  • 受众定向的不同


精准广告中数据的主要应用

  • DMP
  • 人群/用户画像
  • 个性化创意/推荐引擎
42270ede6f1ef621b2c131576487d3d5f33ac8da
2171be14517be86b41ee923275f145b689ae23b0
f25a8b178ee0c25516bba4d27e7e10b4ae7be860

大数据处理分析技术介绍

  • 储存/缓存
  • 计算
  • 算法/规则


储存/缓存

  • Tair/redis2 -> ssdb/redis3 -> aerospike
  • Kafka/DL
  • Mongodb/hbase
  • Hadoop
  • Mysql


计算


  • Hive/mr
  • Storm
  • Spark Streaming


算法/规则

  • 协同过滤(UserCF/ItemCF)
  • 文本相似/图片相似
  • 关联规则(支持度和置信度)
  • 逻辑回归模型
  • 兴趣时间衰减
  • 规则引擎(DNA)


心得体会

  • 做工程不易,且做且珍惜(技术+管理+工匠精神)
  • 建立PDCA效果验证闭环
  • 每一个做技术的都应该有崇高的理想,技术只是手段

分享者简介: 宋慧庆 ,时趣互动 移动广告架构师 十余年互联网老司机,具有多年互联网广告系统研发经验,负责研发个性化动态创意系统,用户画像标签系统以及大数据治理;对编程语言有浓厚的兴趣。
相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
25天前
|
存储 大数据 数据处理
PHP 与大数据:构建高效数据处理系统
传统的数据处理系统往往难以应对大规模数据的处理需求,而PHP作为一种常用的服务器端脚本语言,在数据处理方面也有其独特的优势。本文将探讨如何利用PHP构建高效的大数据处理系统,结合实际案例分析其应用场景及优势所在。
15 2
|
1月前
|
存储 分布式计算 大数据
现代化数据库技术——面向大数据的分布式存储系统
传统的关系型数据库在面对大规模数据处理时遇到了诸多挑战,而面向大数据的分布式存储系统应运而生。本文将深入探讨现代化数据库技术中的分布式存储系统,包括其优势、工作原理以及在大数据领域的应用。
|
1月前
|
安全 Java 大数据
基于大数据的旅游系统的设计与实现(论文+源码)_kaic
基于大数据的旅游系统的设计与实现(论文+源码)_kaic
|
2月前
|
监控 物联网 大数据
智慧工地管理平台系统源码基于物联网、云计算、大数据等技术
智慧工地平台APP通过对施工过程人机料法环的全面感知、互联互通、智能协同,提高施工现场的生产效率、管理水平和决策能力,实现施工管理的数字化、智能化、精益化。
56 0
|
3月前
|
人工智能 自然语言处理 大数据
AI大数据智能导诊系统源码 Springboot框架
智能导诊系统是在医院中使用的引导患者自助就诊挂号,在就诊的过程中有许多患者不知道需要挂什么号,要看什么病,通过智慧导诊系统,可输入自身疾病的症状表现,或选择身体部位,再经由智能导诊系统多维度计算,AI智能引擎分析、准确推荐科室,引导患者挂号就诊,实现科学就诊,不用担心挂错号。
57 0
|
4月前
|
SQL 数据可视化 关系型数据库
【大数据实训】基于Hive的北京市天气系统分析报告(二)
【大数据实训】基于Hive的北京市天气系统分析报告(二)
63 1
|
4月前
|
负载均衡 大数据 应用服务中间件
[新星计划]大数据故事集__从超市收银来看网站系统的发展
[新星计划]大数据故事集__从超市收银来看网站系统的发展
37 0
|
4月前
|
分布式计算 网络协议 Hadoop
大数据成长之路------hadoop集群的部署 配置系统网络(静态) 新增集群(三台)
大数据成长之路------hadoop集群的部署 配置系统网络(静态) 新增集群(三台)
27 0
|
4月前
|
分布式计算 资源调度 大数据
【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解(图文解释)
【大数据技术Hadoop+Spark】Spark架构、原理、优势、生态系统等讲解(图文解释)
199 0
|
4月前
|
消息中间件 存储 算法
【云计算与大数据技术】数据编码LZSS算法、Snappy压缩库及分布式通信系统的讲解(图文解释 超详细)
【云计算与大数据技术】数据编码LZSS算法、Snappy压缩库及分布式通信系统的讲解(图文解释 超详细)
78 0

热门文章

最新文章