《营销数据科学：用R和Python进行预测分析的建模技术》—

《营销数据科学：用R和Python进行预测分析的建模技术》——第1章了解市场

2017-05-02 3545

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本节书摘来自华章出版社《营销数据科学：用R和Python进行预测分析的建模技术》一书中的第1章，作者：[美]　托马斯 W. 米勒（Thomas W. Miller）　著崔立真　鹿旭东　译，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

本节书摘来自华章出版社《营销数据科学：用R和Python进行预测分析的建模技术》一书中的第1章，作者：[美]　托马斯 W. 米勒（Thomas W. Miller）　著崔立真　鹿旭东　译，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

第1章了解市场

“是什么让大象在大雾弥漫的天气里或暮霭重重的黄昏中看护自己的象牙？是什么让麝鼠看护它自己的麝香？”
—1939年美国电影《绿野仙踪》中鼠胆狮（伯特•拉尔饰）

在开始“建模技术”系列的第一本书的相关工作时，我从威斯康星州麦迪逊市搬到了洛杉矶，这迫使我在移动通信方面做出一个艰难的决定。多年来我一直都是移动通信运营商U. S. Cellular的客户，使用过一部智能手机和两个数据调制解调器（一个3G，另一个4G），且对这家公司所提供的服务非常满意。2013年5月，这家公司还没有在洛杉矶开设营业网点，也没有在加利福尼亚州开展4G业务。我是一名数据科学人员，需要获取偏好和选择方面的案例，所以我决定去评估一下自己在洛杉矶市场上获得移动通信服务的真实感受。
我的实证研究包括移动通信运营商或品牌、启动成本和月度成本、运营商是否在该地区提供4G业务、运营商是否在附近开设有营业网点，以及运营商是否在支持平板电脑的基础上还对苹果、三星或Nexus手机提供支持。电脑可以轻松生成综合了以上属性的产品轮廓图。我的考虑包括AT&T、T-Mobile、U. S. Cellular以及Verizon四家公司。我一共生成了16个产品轮廓图，并对它们进行随机排列。产品轮廓图、属性及我所给出的排名如表1-1所示。

_1_2

为偏好排名设计的线性模型是传统联合分析法的一个示例，传统联合分析法这一建模技术主要用于显示产品属性对购买决定所产生的影响。联合分析法本质上是联合计量。营销分析师把产品轮廓图介绍给消费者，而产品轮廓图是由其属性来定义的。通过排名、打分或选择产品，消费者就显露了自己对产品的偏好以及能够界定产品的相应属性。属性的权重值和效用值是由电脑根据以小组为单位或以综合方式得到的数据的属性水平计算得出的，因此得名联合分析法。排名、打分或选择的相关任务可以有多种形式。
在进行联合分析时，我们使用了求和对比法，因而每一个属性在不同层次上拟合的回归系数为0。拟合回归系数代表了效用的联合计量，称为效用值。效用值反映了个体消费者对本研究中的每一个属性在每一个层面上的偏好程度。效用值为正值时会增加产品在消费者心中的价值，而为负值时则会减少产品在消费者心中的价值。当我们对一个产品的各个效用值进行求和时，就可以得到对产品的效用性或产品对消费者产生相关好处的相关数据。
为了演示这个联合分析的结果，我们使用了特殊类型的点阵图，称为脊柱图，如图1-1所示。在这个脊柱图中，效用值可以对各个属性按照相同和标准化的比例进行展示。中间的竖线（也就是脊柱）标记为0。
每一项属性在每一个层次的效用值在图中都显示为一个点，并有一条水平连接线从脊柱延伸出来。所偏好的产品或服务特性的效用值为正数时位于脊柱的右侧，偏好程度低的产品或服务特性则位于脊柱的左侧。
脊柱图显示了标准化的效用值和属性权重值。在一个联合分析中，属性的相对权重性是由属性中效用值的范围来决定的。这些权重值都设定了比例，以满足所有属性的总和是100%。联合分析法是一项计量技术。效用值和属性权重值是联合计量手段。
脊柱图显示了消费者的何种偏好性呢？图中显示月度成本具有举足轻重的作用，重要性次之的则为是否提供4G业务。启动成本作为一次性成本，其重要性与月度成本相比要低很多。这位消费者对四家服务提供商的排名基本相同，是否在其附近设有营业网点对他来说并不算是一项优势。这位消费者可能是一位安卓手机用户，因为在其重要性排名中，我们看到他将能够提供三星手机和平板电脑的服务供应商排在第一位，提供Nexus手机的次之，而是否有苹果手机和平板电脑则显得无足轻重。
_1_1

图1-1　移动通信服务偏好的脊柱图
这个研究看似简单，却反映了这位消费者的多方面情况，因为这个研究对消费者的偏好进行了计量。另外，这个适用于综合排名的线性模型也可用来预测这位消费者将来有可能在移动通信方面所发生的行为。
传统联合分析法代表了预测解析法中的一种建模技术。我们通过与不同消费者群体开展合作，找到了一个线性模型来满足每个个体的评分或排名，这样就可以计量出每一种属性在每一个层次上的效用性或效用值以及这些属性的相对权重。
我们不仅可以对联合研究中获得的计量数据加以分析来确定消费群体，还可以通过联合计量来预测每个个体在市场上所做的选择，并使用联合计量对市场进行模拟，研究替代产品的设计和相关的定价政策。消费者在对调查的反馈中表面上反映的是他们的偏好，实质上反映的是他们在市场上所做的选择。
营销数据科学是预测解析法或数据科学的一个专业分支，包括建立卖方和买方的偏好模型并运用这些模型对未来的市场行为进行预测。本书中所使用的大部分例子主要是关注消费者的，但我们开展研究（包括数据准备和组织、计量、模型）的方式却与所有的市场相关，无论是B2C（企业对消费者）的形式还是B2B（企业对企业）的形式。
商家经常问的一个问题是，买方在进行选择时其背后有什么动力？他们想知道在选择过程中有什么因素在发挥重要作用，有哪些因素会对选择产生决定作用。买方行为多受产品特色、品牌和价格的影响，仅就此点而言，商家完全有能力左右买方行为，且在增加需求量、提高营业收入和收益率等方面也是大有可为的。
在本章中，产品的特色、品牌和价格是选择手机时所涉及的部分内容。但仍然有很多其他因素可以影响买方的行为，其中有些属于不可计量的因素，有些是超出管理层控制范围的因素。图1-2展示了了解市场行为的一个框架，也就是在市场上买卖双方如何进行选择。
tu1_2

图1-2　市场：买方和卖方的交易场所
正如我们从经济学中所了解的那样，市场是一个买方和卖方聚集的地方或渠道。买方代表的是需求方，卖方代表的是供给方。为了预测何种产品将被出售和购买以及产品的市场出清价格等未来的市场变化，我们假设卖方永远追求利润最大化，并在此基础上研究买卖双方在过去发生的行为及特点。我们还建立了市场反应模型。这就是本书中所要介绍的营销数据科学的内容。
你去问买方他们想要什么，他们也许会说，当然是最好的东西。你去问他们想花多少钱，他们也许会说，当然是越少越好了。这就是根据直接反应等级量表对买方乐于给钱及其对产品的偏好进行评判时所产生的局限性，这种量表有时也叫自我解释量表。其在编排上通常比较简单，对产品的特性、品牌和价格分别提出问题，但这些问题通常是不相关的，无法抓住影响消费者选择的关键要点。为了从针对买方的调查中获取更多的信息，我们会为其所做的回答设定一些条件，这样可以尽可能多地收集到信息。这就是联合研究和选择研究所要开展的工作，而很多此类研究都能出色地完成相关的工作。在附录B中我们提供了针对消费者偏好和选择进行调查的例证。
联合计量是营销数据科学中的一种重要工具，主要关注买方或市场需求方。这种方法最早是由Luce、Tukey（1964）开发的。对联合方法的综合评估包括传统联合分析法、基于选择的联合、最佳最差等级法量表、基于菜单的选择，是由Bryan Orme （2013）提供的。联合分析法主要运用于新产品的设计和定价研究，我们会在本书后面讨论。
例证1-1和例证1-2分别展示了用于分析有关消费者偏好排名或评分数据的R程序和Python程序。这两个程序都执行了传统联合分析法。脊柱图则将联合研究和选择研究中的自定义数据呈现出来。附录D中的例证D-1展示了生成脊柱图的R代码。通过使用标准的R语言图形功能，我们一次性建立了这张图的点、线和文本串，且各点、线和文本的精准定位均在我们的控制范围之内。
例证1-1　个人偏好的测量和建模（R）
li1_1_1
li1_1_2
li1_1_3
li1_1_4
li1_1_5