大数据时代，如何构建精准用户画像，直击精细化运营-阿里云开发者社区

大数据时代，如何构建精准用户画像，直击精细化运营

2019-04-02 2866

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 移动互联网时代，精细化运营逐渐成为企业发展的重要竞争力，“用户画像”的概念也应运而生。用户画像是指，在大数据时代，企业通过对海量数据信息进行清洗、聚类、分析，将数据抽象成标签，再利用这些标签将用户形象具体化的过程。

移动互联网时代，精细化运营逐渐成为企业发展的重要竞争力，“用户画像”的概念也应运而生。用户画像是指，在大数据时代，企业通过对海量数据信息进行清洗、聚类、分析，将数据抽象成标签，再利用这些标签将用户形象具体化的过程。用户画像的建立能够帮助企业更好地为用户提供针对性的服务。

与之相应，越来越多的第三方大数据公司，也开始依托自身的数据积累，为客户提供用户画像的服务。比如个推旗下的用户画像产品，能够对用户线上和线下行为进行大数据分析，帮助APP开发者和运营者构建全面、精准、多维的用户画像体系。下文将以个推用户画像产品为例，详解“用户画像”的技术特点和使用价值。

用户画像的形成需要经历四个过程，数据积累、数据清洗、数据建模分析、数据产出。其中，数据清洗和数据建模统称数据处理。在经过数据处理之后，个推产出独特的冷、热、温数据维度，并分析用户的线上兴趣偏好和线下行为场景，形成用户画像。

一、用户画像用了哪些技术？

在数据处理阶段，个推用户画像产品的大数据计算架构采用了Kafka分布式发布订阅消息系统，具有高吞吐量、高稳定性的特点。数据清洗可利用HADOOP、SPARK来实现设备唯一性识别、行为数据的清洗等，去除冗余数据。这一过程支持交互计算和多种复杂算法，并支持数据实时/离线计算。

在数据建模的过程中，个推用户画像产品主要利用了机器学习中的聚类（无监督学习)和深度学习技术，让模型对用户行为数据主动学习，进行行为判断，由此产出用户标签。

经过数据的清洗和建模，个推用户画像会形成冷数据画像、温数据回溯、热数据场景和定制化标签四种画像。
冷数据画像，是指基于大数据的分析得出的用户属性，相对比较稳定，如用户的年龄层次、性别、常驻地等。“温数据”则可以回溯用户近期活跃的线上和线下场景，具有一定的时效性。“热数据”是指用户当下的场景及实时的用户特征，帮助APP运营者抓住稍纵即逝的营销机会。定制化标签是将个推数据与第三方数据结合起来，共同建模得出具有价值的特征标签。

二、如何构建用户画像？

“用户画像”的构建需要技术和业务人员的共同参与，以避免形式化的用户画像。个推构建用户画像时流程如下：

（1）标签体系设计。开发者需要先了解自身的数据，确定需要设计的标签形式。

（2）多数据源数据融合。在建设用户画像时，个推会整合自有海量数据以及该APP自身的数据。

（3）实现用户统一标识。多数情况下，APP的众多用户分布于不同的账号体系中，个推会将其统一标识，帮助APP打通账号，实现信息快速共享。

（4）用户画像特征层构建。即将每一个数据进行特征化。

（5）画像标签规则+算法建模。两者缺一不可，在实际的应用中，算法难以解决的问题，利用简单的规则也可以达到很好的效果。

（6）利用算法对所有用户打标签。

（7）画像质量监控。在实际的应用中，用户画像会产生一定的波动，为了解决这个问题，个推建设了相应的监控系统，对画像的质量进行监控。

总之，个推用户画像构建的整体流程，可以概括为三个部分：

第一，基础数据处理。基础数据包括用户设备信息、用户的线上APP偏好以及线下场景数据等。

第二，画像中间数据处理。处理结果包括线上APP偏好特征和线下场景特征等。

第三，画像信息表。表中应有四种信息：设备基础属性；用户基础画像，包括用户的性别、年龄层次、相关消费水平等；用户兴趣画像，即用户更有兴趣的方向，比如用户更偏好拼团类APP还是海淘类APP；用户其它画像等。

在个推用户画像构建的过程中，机器学习占据了较为重要的位置。机器学习主要应用在海量设备数据整理、数据清洗、数据存储的过程中。

三、用户画像能做什么？

用户画像对电商类、新闻资讯类APP的作用不言而喻，可以帮助APP打造精准推荐系统，实现千人千面的运营。

基于用户特征的个性化推荐

APP的运营者可以通过个推用户画像提供的性别、年龄层次、兴趣爱好等标签，分别展示不同的内容给用户,以达到精准化运营的目的。

基于用户特征指导内容推荐

基于用户特征指导内容的推荐是指找到与目标群体相似的用户群，并利用该相似用户群的行为特征对目标用户进行内容推荐，具体过程如下图：

在实现这一内容推荐的过程中，相似性建模技术起着不可忽视的作用。相似性建模可类比于聚类建模，是无监督学习中的一种。它可以寻找数据中的特征，把具有相同特征的数据聚集在一组，并赋予这些聚集在一起的数据相同的特征标签。根据这些特征标签，寻找具有这些特性的用户，给他们推送相同的内容。

这种推荐方式的优点是，它的自有特征是经过APP长期积淀而来，颗粒度更细，适用性更强，对用户的认识更全面，效果能持续提升。而且它还能针对APP所处行业与自身需求，量身定制匹配算法，让推荐更精准。

此外，个推用户画像能够结合第三方数据做定制化建模，通过双方共同建模得出显著价值和特征标签。这种标签增补的方式不仅能保证推送的内容更精准，同时也可以很大程度地提升流量价值。

四、开发者如何接入？

个推用户画像SDK的接入主要有两个方式：

• SDK集成：客户端集成个推用户画像SDK，进行初始化SDK后，返回给客户一个ID即GIUID(唯一身份标识)，此ID需要由客户端提交到客户服务器，然后服务器通过API接口传入GIUID进行查询用户画像标签数据。

• API接口调用：客户将应用名称、包名及服务端出口IP提供后，返回APP ID等相关信息。客户根据《个推用户画像数据服务接口文档》及《用户画像编码表》集成测试后方可调用API接口查询画像信息。

具体的集成文档参见以下链接：

Android：http://docs.getui.com/gexiang/start/android/

iOS：http://docs.getui.com/gexiang/start/ios/

服务端：http://docs.getui.com/gexiang/start/server/

了解用户，是为了更好地服务用户。正是APP开发者和运营者对用户认知的渴求促生了用户画像。而APP开发者只有把用户的需求放在最重要的位置，才能更好地优化用户的体验，留住用户。接入个推画像SDK，不仅可以帮助开发人员提高开发决策的效率，也可以帮助APP运营人员开展精细化运营，从而提升企业的营销效率和市场竞争力。

大数据时代，如何构建精准用户画像，直击精细化运营

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

大数据时代，如何构建精准用户画像，直击精细化运营

热门文章

最新文章

相关课程

相关电子书