3.6 信息质量模型
信息质量模型在互联网行业和互联网数据化运营中也是有着广泛基础性应用的。具体来说,电商行业和电商平台连接买卖双方最直接、最关键的纽带就是海量的商品目录、商品Offer、商品展示等,无论是B2C(如当当网、凡客网),还是C2C(如淘宝网),或者是B2B(如阿里巴巴),只要是以商业为目的,以交易为目的的,都需要采用有效手段去提升海量商业信息(商品目录、商品Offer、商品展示等)的质量和结构,从而促进交易。在同等条件下,一个要素齐备、布局合理、界面友好的网上店铺或商品展示一定比不具备核心要素、布局不合理、界面不友好的更加容易达成交易,更加容易获得买家的好感,这里揭示的其实就是信息质量的重要价值。
为让读者更加直观了解信息质量的含义,下面通过某网站的截图来举例说明什么是信息质量好的Offer效果,如图3-1和图3-2所示。
不难发现,相对于图3-2来说,图3-1中有更多的商品要素展示,包括付款方式、产品品牌、产品型号等,另外在详细信息栏目里,所包含的信息也更多更全。也就是说,图3-1中商品Offer的信息质量要明显好于图3-2。
互联网行业的信息质量模型所应用的场合主要包括商品Offer质量优化、网上店铺质量优化、网上论坛的发帖质量优化、违禁信息的过滤优化等,凡是涉及信息质量监控和优化的场景都是适用(或借鉴)信息质量模型的解决方案的。
构建信息质量模型所涉及的主要还是常规的数据挖掘技术,比如回归算法、决策树等。但是对于信息质量模型的需求,由于其目标变量具有一定的特殊性,因此它与目标客户预测(响应)模型在思路和方法上会有一些不同之处,具体内容如下。
任何模型的搭建都是用于响应特定的业务场景和业务需求的,有时候搭建信息质量模型的目标变量是该信息(如商品Offer)是否在特定的时间段产生了交易,此时,目标变量就是二元的,即是与否;更多的时候,信息质量模型的目标变量与是否交易没有直接关系(这其实很容易理解,因为影响成交的因素太多),甚至有些时候信息质量本身是主观的判断,在这种情况下,没有明确的来自实际数据的目标变量。那如何定义目标变量呢?专家打分,模型拟合是一个比较合适的变通策略。
对于专家打分,模型拟合的具体操作,下面以“商品Offer的星级划分”项目为例来进行具体的解释和示范。商品Offer其实就是网上交易中,卖家针对每种出售的商品展示具体的商品细节、交易条款、图片细节等,使其构成的一个完整的页面,一般来说买家浏览了某种具体的商品Offer以后,只要点击“加入购物车”就可以进行后续的购买付费流程了。在某次“商品Offer的星级划分”项目中,目标变量就是专家打分,由业务专家、行业专家基于行业的专业背景知识,针对商品Offer构成要素的权重进行人为打分,这些构成要素包括标题长度、图片数量、属性选填的比例、是否有分层价格区间、是否填写供货总量信息、是否有混批说明、是否有运营说明、是否支持在线第三方支付等。首先抽取一定数量的样本,请行业专家对这些样本逐个打分赋值,在取得每种商品Offer的具体分数后,把这些分数作为目标变量,利用数据挖掘的各种模型去拟合这些要素与总分数的关系,最终形成一个合适的模型,该模型比较有效地综合了专家打分的意见并且有效拟合Offer构成要素与总分数的关系。为了更加准确,在专家打分的基础上,还可以辅之以客户调研,从而对专家的打分和各要素的权重进行修正,最后在修正的基础上进行模型的搭建和拟合,这属于项目的技术细节,不是项目核心,故不做深入的讲解。
信息质量模型是电子商务和网上交易的基本保障,其主要目的是确保商品基本信息的优质和高效,让买家更容易全面、清楚、高效地了解商品的主要细节,让卖家更容易、更高效地展示自己的商品。无论是C2C(如淘宝),还是B2B(如阿里巴巴),抑或是B2C(如当当网、凡客网),都可以用类似的方法去优化、提升自己的商品展示质量和效果,有效提升和保障交易的转化率。