4. 用户画像整体方案需要考虑的几个模块
下面对部分模块简单说明
4.1 数据指标体系
根据业务线梳理:用户属性、用户行为、用户消费和风险控制等维度的指标体系。
4.2 标签数据存储
标签数据可根据应用场景的不同,存储在Hive、MySQL、HBase、ES等。
4.3 标签数据开发
三类标签(统计类、规则类、挖掘类)的开发,打通画像数据和各业务数据之间的通路,提供接口服务等开发内容。
4.4 作业调度工具
4.5 用户画像产品化
可以理解为用户画像对用户提供的一个可视化UI,提供一个与用户画像系统进行交互的工具。让用户数据更好的服务于业务方,以产品化的形态应用在业务上。
产品化的模块主要包括标签视图、用户标签查询、用户分群、透视分析等。
4.6 用户画像应用
应用场景包括:用户特征分析、Push 消息的精准推送、客服针对用户的不同话术、针对高净值用户的极速退货退款等 VIP 服务应用。
5. 用户画像建设项目流程
总体流程图如下:
下面针对上述模块进行详细的分析解读
5.1 画像的需求分析和目标解读
明确用户画像服务的对象:运营人员和数据分析人员。不同服务对象他们对画像有不同的侧重点。
运行人员
例如运营人员需要分析用户的特征、定位用户行为偏好,做商品或内容的个性化推荐,以提高点击转化率,因此其关注的用户画像侧重点落在了用户个人行为偏好上。
数据分析人员
他们需要分析用户特征,做好用户流失预警工作,还可根据用户的消费偏好做更有针对性的精准营销。
5.2 任务分解和需求调研
我们已经知道画像将要服务的对象和应用场景,接下来要结合产品现有业务体系和“数据字典”规约实体和标签之间的关联关系,明确分析维度。
例如我已从不同的角度进行业务建模:用户属性画像/用户行为画像/用户偏好画像/用户群体偏好画像。
5.3 需求场景讨论与明确
明确需求场景和标签维度、标签类型:数据运行人员和需求方的沟通结果是,输出产品用户画像需求文档,在文档中明确画像应用场景、最终开发出的标签内容和应用方式。
5.4 应用场景和数据口径确认
数据运行人员结合业务与数据仓库中已有的相关表,明确与业务场景相关的数据口径。运营方输出产品用户画像开发文档(文档中需明确应用场景、标签开发的模型、涉及的数据库和表,以及应用实施流程)。
5.5 特征选取和模型数据落表
根据需求场景进行业务建模,开发HQL逻辑,将逻辑生成的数据写入临时表,并抽取数据校验是否符合业务场景需求。
5.6 线下模型数据验收和测试
数仓团队的开发人员将相关数落表后,设定定时调度任务,定期增量更新数据,数据运行人员要验收表中数据是否在合理范围内,发现问题反馈给数仓人员调整HQL代码逻辑和行为权重值。
5.7 线上模型发布和效果追踪
将开发好的HQL部署上线,上线后持续追踪标签应用效果。调整优化模型即相关权重配置。
6. 每阶段的产出物
打通数据服务层:用户画像最终的价值出发点是业务方应用画像数据进行用户分析,多渠道触达运营用户,分析ROI,提升用户活跃度和应收。
7. 参考资料
《用户画像:方法论与工程化解决方案》