零售数据观(一):如何花30分钟成为一个标签设计“达人”

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 作者简介:铁叫兽,10年+数据相关经验,曾在电信、阿里从事过DBA,数仓,解决方案,目前从事零售行业的解决方案。序言:是否碰到大量的人力投入基于流程管理的信息化系统建设,也运行了好几年了,同时大数据也热了好几年了,但企业IT部门还是无从下手,既不确信大数据是否可以真的带来业务价值也不清楚从哪着手更容易推动大数据项目落地,本文就是通过“标签”,一种基于具体业务场景但同时又是业务人员看的懂的数据的方式,帮助企业从点做起,循序渐进,让大数据真正落地。


作者简介:铁叫兽,10年+数据相关经验,曾在电信、阿里从事过DBA,数仓,解决方案,目前从事零售行业的解决方案。

序言:是否碰到大量的人力投入基于流程管理的信息化系统建设,也运行了好几年了,同时大数据也热了好几年了,但企业IT部门还是无从下手,既不确信大数据是否可以真的带来业务价值也不清楚从哪着手更容易推动大数据项目落地,本文就是通过“标签”,一种基于具体业务场景但同时又是业务人员看的懂的数据的方式,帮助企业从点做起,循序渐进,让大数据真正落地。

一、什么是OLP

  1. 什么是OLP模型

OLP是Object-Link-Perperty的缩写,Object代表业务场景中的实体,可以是“人”(如会员、零售商)也可以是“物”(如商品、店铺);Link 是代表业务场景中的“关系”,关系分为行为关系和事实关系,用户“购买”商品,其中“购买”就是一种行为关系,货架“属于”门店,其中“属于”是一种事实关系;而Perperty则代表实体和关系上的属性,如“会员”(人)有年龄、手机号、性别等属性,“门店”(物)有地址、所在城市等属性,“购买”(关系)有支付时间,支付形式等属性。

!

企业往往可以根据自身业务系统的建设情况逐步完善OLP模型,它是识别大数据场景和标签设计的基础。

二、如何识别大数据场景

  1. 什么是大数据场景

大数据场景目前分两类,一类是优化原来的业务流程,提高效率,变得更加智能(如让信息推送变为“智能”,做到个性化推送,从而提升ROI),第二类是创造新的业务流程,让以前不敢尝试的业务可以实现(如小额贷款,以前是因为风险无法得知从而不敢尝试,通过采购商或零售商的数据化然后建模就可以逐步尝试)。此篇文章中的大数据场景识别仅针对第一类情况。

  1. 如何识别

既然是优化原来的业务流程,那就重点关注可以产生变化的“关系”(人和物无法改变),主要判断OLP模型的“行为关系”看是否能从时间或空间维度用大数据的能力进行优化,如上图中所描述的“购买”和“上架”行为关系。那“购买”是否是大数据场景,答案是“否”,因为从时间维度可以通过对商品通过RFID的技术做到无人门店从而改善用户的购买效率,但所用技术并不是大数据范畴。但,是否让“上架”变的更加智能,答案是“是”,从时间维度,不同城市,不同门店类型,对于什么商品什么时间上架完全可以基于大数据的智能决策,是可以帮助门店或零售商合理的安排库存结构,同时还可以对“上架”进行空间维度的优化,如商品的摆放位置,具体这里就不展开了。接下来我们让上图的OLP模型变的更加复杂一点。


(OLP示意图)

我们找出行为关系,从时间和空间维度上考虑是否可以是大数据场景:

1)购买:不是

2)上架:是,用数据来决策何时上架

3)推送:是,不同用户推送不同的信息,智能推送

4)点击:不是

5)存储:不是

6)入库:是,什么商品何时入库从而优化库存结构

但是需要注意一点,脱离业务场景讨论“关系”,看是否是大数据场景是不合理的,比如购买,如一服装加盟商因某些原因,需要再次购买(采购)商品(中央库存足够的情况下),那什么时候购买,就可以用上大数据的能力。有了数据场景,接下来讨论下如何构建“标签”。

三、如何构建标签

  1. 什么是标签

标签是业务人员看的懂的数据,可分为原始标签、统计标签和算法标签。

  1. 如何构建

第一个原则,标签设计是面向大数据场景的,比如上文提到中的“推送”,那现在就对“推送”关系相关联的“活动”和“用户”做为维度进行标签设计, 这里主要介绍以“用户”做为举例。实体和关系上的属性是标签设计的基础。


(简化后的示意图)

通过用户的属性所生成的标签:性别、手机号;根据购买关系所生成的标签:支付形式偏好、购买时间段偏好,消费金额,消费笔数;根据商品属性所生成的标签:风格偏好、材质偏好、颜色偏好;根据展架属性所生成的标签:商品摆放位置偏好;根据线下门店属性所生成的标签:所属城市,在上面标签设计过程,其实引入了第二个原则,实体和关系的属性是可传递的,比如实体“线下门店”的属性是可以来描述实体“用户”的,这很关键,这样的思维方式可以保证在设计标签时,被描述的实体维度会足够的完整。大家还会发现为啥标签“商品摆放位置偏好”标注为灰色,因为根据原则一,它对“推送”场景没有意义(目前是否有用,还是靠经验,大家如果有其他想法可以一起来探讨),有了这类标签后,就可以对标签进行业务上的“衍生”,比如,平均消费金额(消费金额/消费笔数)、消费水平(参考因子:所属城市、消费金额、消费笔数等),最后在业务衍生的基础上考虑时间维度:比如最新3个月消费金额,工作日消费金额,这是第三原则,可对标签在业务上和时间上进行“衍生”。

各位还记得标签的分类,那上面所描述的“性别”、”手机号“和“所属城市”就属于原始标签(和业务数据库存的一样),“支付形式偏好”、“消费笔数”和“材质偏好”等就属于统计标签,“消费水平”就属于算法标签。

四、如何使用

在上文讨论的“推送”场景下,店长就可以自由选择标签,通过设置各种标签值范围人群圈选,进行个性化推送,比如,最近上线几款全棉的高端上衣,店长就可以在系统中设置条件(最近三个月消费金额>’2000’ and 材质偏好=‘棉’),可定义为"全棉高端消费人群”,然后进行短信或者公众号对这类人群进行推送。业务人员通过标签设置各种标签值范围我们常把这种操作为人群洞察。

五、总结

通过以上的介绍,相信各位对如何标签设计有了个大致的理解(建议读两遍),但标签设计非常考验对业务的理解和对数据的感觉,需要日积月累,当然也可以加速这个过程,比如选择数澜科技的数据咨询服务。

想了解更多内容可访问数澜社区——国内首个数据中台交流社区(https://bbs.dtwave.com/

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
7月前
|
算法 决策智能
如何用算法规划完美的相亲假期 - 小美的春节排班挑战
排班是一个经典的组合优化问题,而相亲排班可谓是它的一种别出心裁的应用。小美的挑战在于,如何在有限的8天空闲时间内,安排至少12场有效的相亲,并且满足诸如“父母严选”和通勤时间等一系列复杂的条件。
|
数据可视化 BI 数据安全/隐私保护
90后老板用低代码整顿旅行社,创2000万年收,他是怎么做到的?(真实)
90后老板用低代码整顿旅行社,创2000万年收,他是怎么做到的?(真实)
|
算法 数据挖掘 BI
新高考增值评价系统业务简单介绍(超详细,图文并茂)
新高考增值评价系统业务简单介绍(超详细,图文并茂)
706 0
新高考增值评价系统业务简单介绍(超详细,图文并茂)
|
人工智能 供应链 算法
置顶用户需求,vivo如何用创新方法论交出新成绩单?
2019年,手机行业刮起了一阵疾风:贴牌科技受到诟病,用户开始鄙视伪创新。 全球科技媒体的指数正呈现这样一个趋势:越是深度创新,具备差异化应用性的技术与产品,正在得到越多的用户青睐和舆论赞扬。 但对于终端厂商而言,挑动硬件、系统等核心技术并非易事,厂商们的创新如何体现? 这一挑战正在被vivo逐渐达成,这家手机厂商打算“从头开始”!
194 0
置顶用户需求,vivo如何用创新方法论交出新成绩单?
|
机器学习/深度学习 数据采集 自然语言处理
商品评价里藏了一座“宝藏”,阿里工程师如何挖掘?
小叽导读:买家评价是消费者购物后对商品的真实反馈。多数买家评价中包含了“消费者常问问题”的回答。比如冰箱,大家可能关心“声音大吗?”、“耗电吗?”、“容量大不大?”,这些问题通常可以在评论区找到其他消费者的使用反馈。这部分信息能够有效地帮助消费者购买到心仪的产品,那么,如何让这些评论匹配到不同人的需求?接下来, 天猫的“大家最关心”告诉你答案。
1426 0
商品评价里藏了一座“宝藏”,阿里工程师如何挖掘?
从内涵段子被下架、快手禁用评论探讨其背后的技术细节
最近闹得沸沸扬扬的是内涵段子被下架,无数网友表示很舍不得,紧接着抖音、快手都在做整改。我当时看到这个新闻的时候不是看内容如何,而是凭借着职业习惯,第一眼就想到了为啥它们这些app可以快速响应国家政策,做出调整?技术上是如何实现的?下面我凭自己的开发经验大概的讲一下如果是我做我会怎么做,思路如下: 写这篇文章的目的:不是为了凑数写的,而是从技术层面去分析大型app可能会怎么做,我们不光要看一个事件,还要要看背后的技术实现。
1713 0