前 言
为什么要写这本书
在我做数据分析培训和咨询的过程中,经常会有学员来问我,有没有合适的统计分析方面的参考书可以推荐。被学员问得多了,慢慢地就有了写本书的冲动,一是毕竟自己写的书和培训的内容比较配套,二是写书对自己来说也是一个总结和提高的过程吧。
“理想很丰满,现实很骨感”,原来觉得自己手里有不少案例,各种工具的使用也算是比较熟练,写起书来应该得心应手,进度也会比较快,但是真到开始动手写作时,才发现并不是那么简单。从框架目录的确定、章节内容的选择、语言风格的打磨,到分析结果截图的选择等,每一个环节都需要细细地思量和斟酌。这本书的写作使我从2016年4月到11月的这段时间非常疲劳,颈椎病也复发了,因为在写书的同时,我的数据分析方面的培训并没有停止。
我在写作本书的时候,给自己规定了几个原则:
一是要实用,要能够解决企业工作中的实际问题
。
二是要尽可能地降低读者上手的难度,那种操作非常繁复、需要强大坚实的统计分析理论基础,或者需要编程才能实现的功能,我都没有放在本书中。原因很简单,即使本书讲了那些难度比较大的内容,读者也很难真正应用起来。
三是语言风格尽可能轻松活泼一点,尽量避免很严肃、很晦涩的专业术语,我很难做到“寓教于乐”,但还是尽己所能让本书的阅读轻松一点吧。
在本书的写作过程中,我经常提醒自己这三条原则,并且要求自己遵守它们。
简言之,给读者带来一本“有用的、上手比较容易的、读起来比较轻松的”数据分析书,这就是我写这本书的原则和动力。
目 录
[第1章 什么是数据分析
1.1 一眼就看到结论还需要数据分析吗](https://yq.aliyun.com/articles/118532/)
1.1.1 企业数据量
1.1.2 数据复杂度
1.1.3 数据颗粒度
1.2 数据分析能给我们带来什么
1.2.1 了解数据的整体状况
1.2.2 快速查询数据
1.2.3 数据之间关系的探索
1.2.4 业务预测
1.3 数据分析的几大抓手
1.3.1 足够多的数据
1.3.2 数据质量
1.3.3 合适的工具
1.3.4 分析结果的呈现
1.4 数据分析的流程
1.4.1 数据采集
1.4.2 数据整理
1.4.3 制表
1.4.4 数据分析
1.4.5 数据展示(呈现)
1.5 如何成为数据分析高手
1.5.1 “拳不离手,曲不离口”
1.5.2 熟练掌握常用工具
1.5.3 最好能编点程序
1.5.4 一定要通晓业务
[第2章 数据分析的理论、工具、模型
2.1 基本概念和术语](https://yq.aliyun.com/articles/118578/)
2.1.1 基本概念
2.1.2 术语
2.2 选择称手的软件工具
2.2.1 EXCEL
2.2.2 VBA
2.2.3 Access
2.2.4 SPSS
2.2.5 XLSTAT
2.2.6 Modeler
2.2.7 R语言
2.3 在分析需求和模型之间搭起桥梁
2.3.1 识别需求
2.3.2 分解需求
2.3.3 选择工具和模型
[第3章 数据采集与整理
3.1 数据采集的几条重要原则](https://yq.aliyun.com/articles/118590/)
3.1.1 要足够“复杂”
3.1.2 要足够“细”
3.1.3 要有“跨度”
3.1.4 要有可行性
3.2 用“逐步推进法”推测需要的数据
3.3 耗时耗力的数据整理过程
3.3.1 重复、空行、空列数据删除
3.3.2 缺失值的填充和分析
3.3.3 数据间逻辑的排查
3.4 数据量太大了怎么办
3.4.1 放到数据库中处理
3.4.2 用专业工具处理
3.4.3 数据抽样