一、背景
这篇文章主要分享在一些中小型公司做用户画像,但是画像数据不全的情况下怎么做,大家都知道比如说:在支付宝或者一些银行,有你的身份证数据、有的存款数据,很容易拿到年龄,和你的资产情况,但是在一些其他的公司怎么办呢?比如说,还是想知道的资产情况或者消费情况,但是如果不是一些金融公司,比如说:游戏公司、视频公司、甚至一些更小的公司,根本拿不到用户资产数据。
因此,是不是可以考虑用一个折中的方法来做资产评估,比如说:用户的手机是什么情况?比如说:是苹果手机还是红米手机,或者是iphone最新款还是iphone 4呢?一般只要安装或者访问了app或者网站,都能采集到用户的手机设备信息。
二、数据处理思路
当一个用户访问京东或者淘宝等电商网站或者玩王者荣耀的时候甚至看视频的时候,都会上报设备相关的信息,比如设备的机型信息,存储信息等,数据如下表所示,但是实际是得不到手机品牌机型等数据的,只有处理之后才能得到。
具体加工流程如下:
采集到的原始数据
第一步:需要映射手机机型到营销名的映射,比如:iPhone3,1 其实对应的是iphone 4;M1805E2A 对应的是小米 8SE,具体映射网站参考:https://github.com/KHwang9883/MobileModels,https://blog.csdn.net/qq_19926599/article/details/86747401?spm=1001.2014.3001.5506
第二步:爬取中关村手机的信息数据,得到如下表格
第三步:最终我们借助第一步的字典映射数据即可匹配上用户
这样就得到了一个设备的手机详细数据, 爬虫代码参考:https://github.com/zhugezifang/webmagic-collector
三、总结
在一些中小型公司没有太全的数据的时候,可以考虑利用现用的数据,然后结合一些可以提取的数据,这样也能加工出来一些有价值的数据。比如说:可以根据加工手机的价格或者品牌、甚至系列来做一些营销,给价格高的手机或者高端机(苹果、华为的高端机)进行投放更优质的广告
本篇文章只是以手机信息为例讲解如何在中小型公司做用户画像,很多中小型公司由于没有大公司那么全的数据,导致可挖掘的数据非常有限,本文也提供了一个思路如何在数据有限的情况下结合先有数据和网上数据融合一样能达到想要的要求。