推给我的广告都跟我最近看的内容有关系,怎么做到的?

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 互联网的商业模式,商业化变现不外乎后向收费的广告模式,以及面向最终消费者的前向收费模式。广告尤其是重头。就连淘宝天猫的模式本质上也是赚的广告的钱。那么,大数据在广告中是如何起作用的?

导读:互联网的商业模式,商业化变现不外乎后向收费的广告模式,以及面向最终消费者的前向收费模式。广告尤其是重头。就连淘宝天猫的模式本质上也是赚的广告的钱。那么,大数据在广告中是如何起作用的?

作者:吴俊
来源:大数据DT(ID:bigdatadt)

image

01 我看到的广告都跟我最近看的内容有关系,这是怎么做到的呢?

有同学曾经给我说过这么个故事:她曾在某社交APP,讨论组中,围观宝妈们,有关“婴儿护理”的讨论,其中一位宝妈,发帖询问什么纸尿布好?当她打开某购物APP时,赫然发现,婴儿纸尿布的广告,就出现在了,首页推荐上。“才几秒钟时间,我只是看了别人的帖子,就被精准推送,太可怕了。”她说。

这是怎么实现的呢?用户的个人隐私数据有被泄漏吗?

这也是作为普通用户最好奇的精准广告,是如何获取我的数据,并追着我投放广告的问题?

首先是,运用大数据技术,对用户行为、喜好、及兴趣,包括浏览的内容,进行学习分析,打上不同的标签

然后,广告主投放广告时,会选取不同的标签,进行定向投放,并分析不同标签的广告效果差异分析,并调整不同的人群标签进行定向投放。

上面到的这个故事的技术处理的过程,就是这位女士先被打上了“母婴/纸尿布”的标签。这样自然就被投放“纸尿布”的广告了。

当然从技术细节上,标签都是被打在设备ID上的,这些设备ID,是可被用户重置,防止继续追踪的(在文末推荐的《大数据程序化广告实践》这套音频课程中我会详细介绍如何重置的方法)。这个过程并不知道具体用户在现实世界中的信息

而且,用户行为记录的原始数据是不可被保存的,仅仅是抽象后的标签数据。

这也是我们常说的,保护用户隐私数据,原始数据不可被使用,且需匿名化处理

image

02 标签是怎么打出来的?

有很多同学,行业外的新闻记者以及对互联网十分感兴趣的同学,甚至还有很多互联网从业者,媒体方负责商业化变现的同学,经常来问我标签是怎么打出来的。下面我们就快速介绍一下:

人群特性标签,即对目标受众的特性刻画,一般会从基础的人口属性、兴趣爱好、消费倾向等等,标签维度来描绘:

人口属性:基本的人口属性如:性别、年龄、区域、学历职业、收入水平、家庭资产状况(车、房)、人生阶段等等。这些很多是结合互联网行为大数据,并基于一定真实样本数据基础上,依据行为相似度匹配而得出的(对行为相似度,举个例子:通过样本发现男性关注跑车资讯的行为特点较为突出,就会将关注跑车资讯类行为的用户都打上男性的标签。)。相对而言真实样本数据的规模,对数据的有效性影响较大。

兴趣爱好:数码、户外、美食、美容、收藏、家居装修等等。这些更多的是依据用户的互联网浏览行为的大数据而得出的。

消费倾向:房产、汽车、金融、家电、个人护理等等。这些更多来源的是用户的线上电商及线下店的浏览、加购物车及消费行为的大数据。

image

这些标签也是我们经常说的人群标签。从保护用户隐私的角度来看,一般在使用用户行为数据时,尽量避免使用原始数据及个体的数据

一般都是会对于用户行为数据进行分析后打上标签。这样对用户打标签的方式也是为了尽量保护用户隐私,在程序化广告领域是较为常见的一种做法。

例如:广告投放系统,都会提供很多人群标签,供广告主选取,投放进行筛选人群,定向投放。基本这些标签体系都会有三到四级,标签总数会有上千种之多。尤其那些偏商品品类的标签最多。

数据已经是新时代不可缺少的燃料,未来商业竞争,最重视对数据的积累的争夺。然而随着各种数据安全的事件频出,大家也都越来越重视数据安全和数据合规的问题,我们来看看到底什么是数据的合规使用?

03 大数据时代基础:人/物的唯一标识

在介绍数据合规使用问题之前,先让我们对需要使用的重要对象“数据”有个较为清晰的认识。

首先一切数据化,连接/追踪的基础是:识别唯一的“人”或“物”。

image

标识人及物的方式越来越丰富多样,线下场景中:图像识别 id、声纹识别 id、face id、RFID、NFC、二维码、条形码等等。

数据按权属,分为第一方、第二方、第三方数据:

第一方数据:数据的拥有方是广告主,简称广告主第一方数据。典型的如广告主内部数据(CRM)及广告主官网布码、线下店面安装设备收集到的数据等,在CRM系统中会有用户的注册会员的时间、会员等级、消费记录、售后记录等等

通过这些数据都可以有效的分析不同用户对不用产品及服务的青睐度、尤其对于发现新的个体销售机会以及新的市场需求都是十分有价值的。

在广告主官网及线下店面收集到的数据会有用户的第一次到访的时间,在某些内容及产品站台前停留的时长,用户的对产品及内容的浏览轨迹,用户对某些内容及产品的关注度,以及用户的回头率等等,对这些数据进行分析,都能十分有效地发现商机及潜在购买意愿的用户。以及对于发掘对于不同人群,产品及内容展示的缺陷及优势都有重大的指导意义。

第二方数据:是广告投放方(媒体方、DSP方等)通过广告投放获取到用户对于该广告在媒体上的互动的数据。所以数据是广告投放方及广告主共同拥有,对广告主而言是第二方数据。

这一类数据主要是广告对用户曝光及用户点击的数据。通过广告对用户的曝光次数数据,我们可以分析广告推广的力度够不够,通过点击数据我们可以分析广告的内容对用户的吸引度够不够。如果再能结合上述的第一方的用户到店及广告后续的数据可以分析广告的效果如何,进而可以分析不同渠道的对产品的推广效用如何等等。

这些都是我们在营销活动中要花好每一分钱,对每一分钱的投入产出评估的十分重要的依据。

第三方数据:同广告主无任何关系,第三方数据供应商提供的数据,对广告主而言是第三方数据。

image

04 什么是数据合规?

个人识别信息(Personally Identifiable Information (PII))是唯一识别消费者的数据。PII是确定性的(能确定它是代表一个特定的人),而不是基于概率论推断的(它很可能是那个人)。例如,数据可包括全名、邮寄地址、电子邮件地址、手机号和出生日期等。

当消费者注册享受服务并事先许可同意共享个人资料详细信息时,个人识别信息通常会被收集。在获取、存储和使用PII进行营销和广告方面有十分严格的用户隐私保护法规,必须遵守这些法规的前提下使用数据,也称为数据合规。

随着各国各地区陆续颁布的系列个人数据保护相关法规,如欧盟的《通用数据保护条例》(General Data Protection Regulation,简称GDPR),以及中国近年来的《网络安全法》《信息安全技术 个人信息安全规范》《网络安全等级保护基本要求》《互联网个人信息安全保护指南》等系列法规,已在对用户个人信息安全保护做出了十分严格的限制

这意味着品牌需要与其供应商和内部IT部门一起制定严格的合规要求。只有使用正确的合作伙伴来确保合规性,才可以继续规划和开展智能的、相关联的、数据驱动的智能营销活动。引用《互联网个人信息安全保护指南》的一小段作为参考:

完全依靠自动化处理的用户画像技术应用于精准营销、搜索结果排序、个性化推送新闻、定向投放广告等增值应用,可事先不经用户明确授权,但应确保用户有反对或者拒绝的权利;如应用于征信服务、行政司法决策等可能对用户带来法律后果的增值应用,或跨网络运营者使用,应经用户明确授权方可使用其数据。

对这段文字的简要解读是:用户对个人数据被采集、被存储或被用于其他第三方服务使用,首先要有在显著之处被告知的知情权,同时用户有对数据被存储及其他第三方服务使用的选择、重置和拒绝的权利,以及对不慎的误操作有及时采取紧急措施,清除数据的权利。

在做用户画像时应严格遵守相关法律法规和行业规范,守好数据获取“最少必要原则”的底线,同时应以更显著直接的方式向用户开放拒绝“被标签”和个性化广告推送的操作入口,让用户享有选择权

在具体日常具体实操作业中,更多对用户的隐私保护声明协议、及合作伙伴的用户数据保护协议等涉及法规类的文件,还需更多借助企业法律部门的帮助和指导建议。所以相关法规及合规性的研究和专业能力,将从常被大家忽视的盲区,越来越成为企业数字化转型和大数据能力建设及人力储备中必不可少的部分和投入要点。

关于作者:吴俊,《程序化广告实战》作者,国内广告PDB(广告私有化程序购买)第一人,20多年IT/互联网行业从业经验,超过6年的大数据营销工作经验。江苏科技大学学士,美国项目管理PMP认证。

原文发布时间:2019-12-04
本文作者:吴俊
本文来自云栖社区合作伙伴“大数据”,了解相关信息可以关注“大数据

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
文本,学习方法,必须做,快的学习方法,统计汇总写法,比如你要构思一个数学库,需要写一个汇总,主动获取标题统计,主动生成文章跳转链接,然后将它打入文章资料当中:
文本,学习方法,必须做,快的学习方法,统计汇总写法,比如你要构思一个数学库,需要写一个汇总,主动获取标题统计,主动生成文章跳转链接,然后将它打入文章资料当中:
聊天框(番外篇)—如何实现@功能的整体删除
上一篇文章中,我们已经初步实现了聊天输入框,但其@功能是不完善的,例如无法整体删除、无法获取除用户名以外的数据(假设用户名不是唯一的)。有问题就要想办法解决,在网上百度了一圈后,倒是有一些收获。本文就着重解决@的整体删除以及获取额外数据。
1115 0
聊天框(番外篇)—如何实现@功能的整体删除
|
存储 搜索推荐 NoSQL
抖音是怎么做到不重复推荐内容呢?
抖音是怎么做到不重复推荐内容呢?
|
SpringCloudAlibaba 算法 前端开发
【Log/Java项目】一个自己写的供情侣们记录生活和表达关心与爱意的小网站
【Log/Java项目】一个自己写的供情侣们记录生活和表达关心与爱意的小网站
290 0
|
数据采集 监控 搜索推荐
什么叫GLB外推?GLB外推怎么做?
答案是:GLB外推就是谷歌搜索留痕的核心技术。 GLB外推的定义与重要性 GLB外推是一种专门用于推广外贸网站的有效方法。 通过GLB外推,企业可以快速提升其产品或服务的知名度,而且这种方法不受行业限制,深受业内一致认可。 在谷歌SEO中,GLB外推起着不可或缺的作用。
434 0
|
JavaScript 开发者
get方式提交新闻防止新闻被覆盖掉(补充说明)|学习笔记
快速学习 get 方式提交新闻防止新闻被覆盖掉(补充说明)
get方式提交新闻防止新闻被覆盖掉(补充说明)|学习笔记
|
数据采集 数据可视化 搜索推荐
网站导航应该这样设计才正确,你应该知道的十个关键点
网站导航的细节设计左右着使用者体验好坏,不管你的网站页面设计得再漂亮,使用者体验不在,自然也留不住浏览者的注意力。从你的网站视觉吸引力、布局,再到文本的运用都是使用者体验的一环,要达到美观与功能之间的平衡,才称得上是一个好网站。
429 0
网站导航应该这样设计才正确,你应该知道的十个关键点
|
数据挖掘 搜索推荐
带你读《广告数据定量分析:如何成为一位厉害的广告优化师》之三:广告数据的描述:图表
这是一部面向初级广告优化师、渠道运营人员的广告数据分析和效果优化的实战指南。数据分析功底的深浅,决定了广告优化师能力水平的高低。这本书一方面告诉读者成为一名厉害的广告优化师需要掌握的数据分析技能,以及如何快速掌握这些技能;一方面又为读者总结了SEM广告、信息流广告、应用商店广告数据的分析方法论和效果优化的方法,以及多广告推广渠道的统筹优化。书中提供大量真实数据案例,助你提升广告数据分析的理论深度和业务水平。
|
iOS开发 Android开发 UED
带你读《好设计,有方法:我们在搜狐做产品体验设计》之三:区分不同载体的设计
那些激动人心、让人拍手叫好的设计,到底有没有方法可循?背后到底有没有设计理论支撑?答案是肯定的!本书作者是资深体验设计专家,拥有超过10年的产品体验设计和团队管理经验,他们将试图为大家总结和揭示那些优秀设计背后的理论和方法。
|
SEO 监控 搜索推荐
如何最大化旧SEO博客帖子的有机价值
如何最大化旧SEO博客帖子的有机价值 如果您曾经参与过SEO活动或管理过网站,那么您已经听过“内容为王”的短语。   虽然陈述是陈词滥调,但这并没有错。 在百度的鼓励下,搜索引擎优化一直在敦促他们的营销伙伴定期创建尽可能多的高质量,有针对性的内容。
1325 0
下一篇
无影云桌面