《 营销数据科学: 用R和Python进行预测分析的建模技术》——导读

简介: “人总会失去养育自己的一切,自然界的事物莫不如此。勇敢的人总是从容应对,静观其变,而不会溜之大吉。” ——2012年美国电影《南方的野兽》中赫什帕皮(奎温简妮·沃利斯饰) 以前的市场营销教材编写者总会推广“营销理念”,说营销既不是销售也不是买卖,而是去了解和满足顾客需求。

daodu1
daodu2
前  言
“人总会失去养育自己的一切,自然界的事物莫不如此。勇敢的人总是从容应对,静观其变,而不会溜之大吉。”

——2012年美国电影《南方的野兽》中赫什帕皮(奎温简妮·沃利斯饰)
以前的市场营销教材编写者总会推广“营销理念”,说营销既不是销售也不是买卖,而是去了解和满足顾客需求。他们往往把“营销研究(市场调查)”和“市场研究”区分开,把前者列为一门商业学科,而把后者划入经济学的范畴。“营销研究”有时也被称为“营销科学”或者“营销工程”。
我们不妨先把过往学术上的自高自大和故弄玄虚放到一边,也不纠缠于语言文字上的是非曲直。营销也好,销售也罢,市场营销也好,市场研究也罢,研究也好,科学也罢,其实都是同样东西的不同表述。在一个被信息技术和即时通信不断改造的世界里,数据就是王道。
数据科学是新型的统计学,是一种融合了建模技术、信息技术和商业智慧的集大成者,更是营销研究所呈现的一种新境界。
在介绍营销数据科学的时候,我们选择的做法是如实反映消费者、市场和营销的现状。今天的研究其实意味着从网页浏览、信息采集、网站检索、在线调查、焦点小组、博客和社交媒体收集数据并加以分析,也意味着能够以最快的速度和最低的成本找到解决问题的答案。
高效地找到答案并不意味着我们必须抛弃科学研究、抽样调查或概率推理的理念。我们在设计营销手段、拟合模型、描述研究结果以及向管理层推荐相应的行动时必须小心谨慎。
当然,有时候我们必须参与相关的研究。要创立调查工具和采访指南。要从消费者样本和焦点小组中收集数据。这就是传统营销研究—定制研究,是专门满足每个个体客户或研究问题的研究。
学习营销数据科学的最佳方法是通过例子来研究。本书提供了可用于建模技术的资源和参考资料。我们向程序设计者展示了如何编写代码来解决真实的业务问题。
关于我们所开展的工作的真实情况都包括在我们编写的程序里。这里的代码是供每个人查看和调试的。为了促进学生的学习,程序包括了对每一个步骤的点评和建议,以供进一步分析。数据集和计算机程序可从网站http: //www. ftpress.com/miller/获取。
在营销数据科学的研究中,有些问题采用Python编程语言比较容易解决,而有些问题采用R编程语言则比较容易解决。有时候也会提供这两种语言的解决方案,以供互相印证对比。Python和R编程语言是研究数据科学的强大工具。
本书中的大多数数据来自于公共领域。许多案例的支撑数据来自于加利福尼亚大学欧文分校机器学习库和斯坦福大学大网络数据组集合。感谢为本书提供这些内容丰富的数据组的相关人员。
我从自己在Research Publishers公司及其主要推广“数据科学作为服务”业务的Tout-Bay分部的咨询工作中学到了很多知识。学术研究和模型能够引领我们达到的境界,目前暂时到此为止了。最后,为了体现差异,需要把我们的想法和模型付诸实施,并与别人分享。
多年来有很多人影响了我的学业和事业。这些人都是很棒的思想者和好心人、好老师,对他们我将永远心存感激。不过令人伤感的是,厄尔西努斯学院哲学专业的杰拉尔德·哈恩·欣克尔和语言专业的阿兰·雷克·莱斯以及明尼苏达大学哲学专业的赫伯特·菲格尔已经永远地离开了我们。我对明尼苏达大学心理测量学专业的大卫J.韦斯和之前在俄勒冈大学经济学专业的凯利·伊金也深表谢意。
感谢多年来与我一起奋战在威斯康星大学麦迪逊分校并提供大力支持的迈克尔L.罗斯柴尔德、尼尔M.福特、彼得R.迪森以及贾尼·克利斯托夫。在我供职A. C.尼尔森营销研究中心主任期间,我认识了营销研究行业的各位领军人物,包括小亚瑟C.尼尔森本人。我还认识和采访了该行业的历史学家杰克·霍诺米奇尔,认识了著有被公认为营销研究重要教材的第一作者吉尔·丘吉尔。我在A. C.尼尔森营销研究中心学习了传统营销研究,非常感激在那里与各位研究人员和执行顾问委员会的各位成员一起工作所获得的宝贵经验。我还要感谢杰夫·沃尔考斯基和尼利·埃斯坡瓦,当在线调查和焦点小组在营销研究中崭露头角之时,他们二位就和我一起共同探索如何使用此类方法进行研究了。
在威斯康星大学麦迪逊分校的任期结束后,我创立了咨询业务公司—Research Publishers公司,与之前的张伯伦研究咨询公司在同一地点办公。沙龙·张伯伦为我提供了开展营销研究业务的基地和场所,正是在那里,本书的相关概念初现雏形:
对于企业而言,有什么事情能比了解客户、竞争对手和市场更加重要呢?管理者要对事情有一个条理分明的观点。消费者研究、产品管理、竞争情报、客户支持和管理信息系统分属各个职能部门,而各个部门之间总是各行其是,管理者想要找到自己所需要的信息也总是困难重重。因此,对研究和信息的整合显得更有意义。(Miller,2008)
我目前的家位于西北大学职业研究学院。我参与三个研究生专业(预测分析理学硕士、数据科学高级证书、体育管理文学硕士)的课程教学工作。营销分析、数据库系统和数据准备、网络和网络数据科学、数据可视化等课程都为本书的编写提供了创作的灵感。
我期待西北大学的研究生课程在进入分析学创业和体育分析学等新领域后不断发展壮大,感谢那些管理着这些与众不同的研究生专业的同事和员工,也感谢众多的学生和教师同仁,我从他们身上获益良多。
TEXnology公司的爱米·亨德利逊运用她的娴熟技艺,使得本书的文字、图表在印刷装帧上非常美观—这也是开源软件的另一项胜利。罗列娜·马丁为本书写了书评,并提供了很多我们非常需要的反馈信息。罗伊·桑福特就统计解读提供了很好的建议。坎迪斯·布拉德利既是书评者又是文字编辑。我对他们各位的指导和鼓励表示感谢。
我还要感谢编辑让娜·格拉舍·列文以及Pearson/FT出版社,感谢他们使本书及“建模技术”系列书得以问世。当然,任何写作问题、错误或语焉不详之处都是我的责任,与他人无关。
我的好友布吕特尼和她的女儿贾妮亚一有时间就陪在我的身边。我的儿子丹尼尔无论顺境逆境也总在我左右,成为我的忘年之交。我对他们亏欠最多,因为他们对我始终充满信任。

托马斯W.米勒
2015年4月于加利福尼亚州格伦代尔市

目  录
第1章 了解市场
第2章 预测消费者的选择
第3章 锁定目标客户
第4章 开发新客户
第5章 维系客户
第6章 产品定位
第7章 开发新产品
第8章 产品促销
第9章 推荐产品
第10章 评估品牌和价格
第11章 利用社交网络
第12章 关注竞争对手
第13章 销售预测
第14章 重新定义营销研究
附录A 数据科学方法
A.1 数据库系统和数据准备
A.2 传统统计与贝叶斯统计
A.3 回归与分类
A.4 数据挖掘与机器学习
A.5 数据可视化
A.6 文本和情感分析
A.7 时间序列与市场响应模型
附录B 营销数据来源
B.1 测量理论
B.2 测量水平
B.3 抽样
B.4 营销数据库
B.5 万维网
B.6 社交媒体
B.7 调查
B.8 实验
B.9 采访
B.10 焦点小组
B.11 现场研究
附录C 案例研究
C.1 AT&T选择研究
C.2 匿名微软网站数据
C.3 银行营销研究
C.4 波士顿住房研究
C.5 电脑选择研究
C.6 DriveTime厢式轿车
C.7 Lydia E. Pinkham医药公司
C.8 宝洁洗衣皂
C.9 返送公仔
C.10 Studenmund餐厅
C.11 悉尼交通研究
C.12 ToutBay再次起航
C.13 两个月工资
C.14 威斯康星州德尔斯
C.15 威斯康星州彩票销售
C.16 维基百科投票
附录D 代码与实用程序
参考文献
索引

相关文章
|
6天前
|
数据采集 存储 API
网络爬虫与数据采集:使用Python自动化获取网页数据
【4月更文挑战第12天】本文介绍了Python网络爬虫的基础知识,包括网络爬虫概念(请求网页、解析、存储数据和处理异常)和Python常用的爬虫库requests(发送HTTP请求)与BeautifulSoup(解析HTML)。通过基本流程示例展示了如何导入库、发送请求、解析网页、提取数据、存储数据及处理异常。还提到了Python爬虫的实际应用,如获取新闻数据和商品信息。
|
27天前
|
数据格式 Python
如何使用Python的Pandas库进行数据透视图(melt/cast)操作?
Pandas的`melt()`和`pivot()`函数用于数据透视。基本步骤:导入pandas,创建DataFrame,然后使用这两个函数转换数据格式。示例代码展示了如何通过`melt()`转为长格式,再用`pivot()`恢复为宽格式。输入数据是包含'Name'和'Age'列的DataFrame,最终结果经过转换后呈现出不同的布局。
39 6
|
27天前
|
数据挖掘 数据处理 索引
如何使用Python的Pandas库进行数据筛选和过滤?
Pandas是Python数据分析的核心库,其DataFrame数据结构便于数据操作。筛选与过滤数据主要包括:导入pandas,创建DataFrame,通过布尔索引、`query()`或`loc[]`、`iloc[]`方法筛选。
|
24天前
|
安全 Python
Python中的并发编程:多线程与多进程技术探究
本文将深入探讨Python中的并发编程技术,重点介绍多线程和多进程两种并发处理方式的原理、应用场景及优缺点,并结合实例分析如何在Python中实现并发编程,以提高程序的性能和效率。
|
6天前
|
分布式计算 Hadoop 大数据
大数据技术与Python:结合Spark和Hadoop进行分布式计算
【4月更文挑战第12天】本文介绍了大数据技术及其4V特性,阐述了Hadoop和Spark在大数据处理中的作用。Hadoop提供分布式文件系统和MapReduce,Spark则为内存计算提供快速处理能力。通过Python结合Spark和Hadoop,可在分布式环境中进行数据处理和分析。文章详细讲解了如何配置Python环境、安装Spark和Hadoop,以及使用Python编写和提交代码到集群进行计算。掌握这些技能有助于应对大数据挑战。
|
1天前
|
数据处理
使用马尔可夫链对营销中的渠道归因建模
使用马尔可夫链对营销中的渠道归因建模
|
1天前
|
数据可视化 算法 API
Python数据可视化-seaborn Iris鸢尾花数据
Python数据可视化-seaborn Iris鸢尾花数据
|
1天前
|
数据处理
R语言使用马尔可夫链对营销中的渠道归因建模
R语言使用马尔可夫链对营销中的渠道归因建模
10 0
|
1天前
|
数据采集 NoSQL 搜索推荐
五一假期畅游指南:Python技术构建的热门景点分析系统解读
五一假期畅游指南:Python技术构建的热门景点分析系统解读
|
1天前
|
程序员 索引 Python
06-python数据容器-set(集合)入门基础操作
06-python数据容器-set(集合)入门基础操作

热门文章

最新文章