《数据分析实战:基于EXCEL和SPSS系列工具的实践》——导读

简介:


image

前  言

为什么要写这本书

在我做数据分析培训和咨询的过程中,经常会有学员来问我,有没有合适的统计分析方面的参考书可以推荐。被学员问得多了,慢慢地就有了写本书的冲动,一是毕竟自己写的书和培训的内容比较配套,二是写书对自己来说也是一个总结和提高的过程吧。

“理想很丰满,现实很骨感”,原来觉得自己手里有不少案例,各种工具的使用也算是比较熟练,写起书来应该得心应手,进度也会比较快,但是真到开始动手写作时,才发现并不是那么简单。从框架目录的确定、章节内容的选择、语言风格的打磨,到分析结果截图的选择等,每一个环节都需要细细地思量和斟酌。这本书的写作使我从2016年4月到11月的这段时间非常疲劳,颈椎病也复发了,因为在写书的同时,我的数据分析方面的培训并没有停止。

我在写作本书的时候,给自己规定了几个原则:

一是要实用,要能够解决企业工作中的实际问题

二是要尽可能地降低读者上手的难度,那种操作非常繁复、需要强大坚实的统计分析理论基础,或者需要编程才能实现的功能,我都没有放在本书中。原因很简单,即使本书讲了那些难度比较大的内容,读者也很难真正应用起来。

三是语言风格尽可能轻松活泼一点,尽量避免很严肃、很晦涩的专业术语,我很难做到“寓教于乐”,但还是尽己所能让本书的阅读轻松一点吧。

在本书的写作过程中,我经常提醒自己这三条原则,并且要求自己遵守它们。

简言之,给读者带来一本“有用的、上手比较容易的、读起来比较轻松的”数据分析书,这就是我写这本书的原则和动力。

目  录

[第1章 什么是数据分析
1.1 一眼就看到结论还需要数据分析吗](https://yq.aliyun.com/articles/118532/)
1.1.1 企业数据量
1.1.2 数据复杂度
1.1.3 数据颗粒度
1.2 数据分析能给我们带来什么
1.2.1 了解数据的整体状况
1.2.2 快速查询数据
1.2.3 数据之间关系的探索
1.2.4 业务预测
1.3 数据分析的几大抓手
1.3.1 足够多的数据
1.3.2 数据质量
1.3.3 合适的工具
1.3.4 分析结果的呈现
1.4 数据分析的流程
1.4.1 数据采集
1.4.2 数据整理
1.4.3 制表
1.4.4 数据分析
1.4.5 数据展示(呈现)
1.5 如何成为数据分析高手
1.5.1 “拳不离手,曲不离口”
1.5.2 熟练掌握常用工具
1.5.3 最好能编点程序
1.5.4 一定要通晓业务
[第2章 数据分析的理论、工具、模型
2.1 基本概念和术语](https://yq.aliyun.com/articles/118578/)
2.1.1 基本概念
2.1.2 术语
2.2 选择称手的软件工具
2.2.1 EXCEL
2.2.2 VBA
2.2.3 Access
2.2.4 SPSS
2.2.5 XLSTAT
2.2.6 Modeler
2.2.7 R语言
2.3 在分析需求和模型之间搭起桥梁
2.3.1 识别需求
2.3.2 分解需求
2.3.3 选择工具和模型
[第3章 数据采集与整理
3.1 数据采集的几条重要原则](https://yq.aliyun.com/articles/118590/)
3.1.1 要足够“复杂”
3.1.2 要足够“细”
3.1.3 要有“跨度”
3.1.4 要有可行性
3.2 用“逐步推进法”推测需要的数据
3.3 耗时耗力的数据整理过程
3.3.1 重复、空行、空列数据删除
3.3.2 缺失值的填充和分析
3.3.3 数据间逻辑的排查
3.4 数据量太大了怎么办
3.4.1 放到数据库中处理
3.4.2 用专业工具处理
3.4.3 数据抽样

相关文章
|
12天前
|
消息中间件 数据挖掘 Kafka
Apache Kafka流处理实战:构建实时数据分析应用
【10月更文挑战第24天】在当今这个数据爆炸的时代,能够快速准确地处理实时数据变得尤为重要。无论是金融交易监控、网络行为分析还是物联网设备的数据收集,实时数据处理技术都是不可或缺的一部分。Apache Kafka作为一款高性能的消息队列系统,不仅支持传统的消息传递模式,还提供了强大的流处理能力,能够帮助开发者构建高效、可扩展的实时数据分析应用。
53 5
|
30天前
|
人工智能 Python
读取excel工具:openpyxl | AI应用开发
`openpyxl` 是一个 Python 库,专门用于读写 Excel 2010 xlsx/xlsm/xltx/xltm 文件。它是处理 Excel 文件的强大工具,可以让你在不需要安装 Excel 软件的情况下,对 Excel 文件进行创建、修改、读取和写入操作【10月更文挑战第3天】
59 0
|
1月前
|
数据采集 数据可视化 数据挖掘
基于Python的数据分析与可视化实战
本文将引导读者通过Python进行数据分析和可视化,从基础的数据操作到高级的数据可视化技巧。我们将使用Pandas库处理数据,并利用Matplotlib和Seaborn库创建直观的图表。文章不仅提供代码示例,还将解释每个步骤的重要性和目的,帮助读者理解背后的逻辑。无论你是初学者还是有一定基础的开发者,这篇文章都将为你提供有价值的见解和技能。
77 0
|
1月前
|
SQL 数据采集 数据可视化
深入 Python 数据分析:高级技术与实战应用
本文系统地介绍了Python在高级数据分析中的应用,涵盖数据读取、预处理、探索及可视化等关键环节,并详细展示了聚类分析、PCA、时间序列分析等高级技术。通过实际案例,帮助读者掌握解决复杂问题的方法,提升数据分析技能。使用pandas、matplotlib、seaborn及sklearn等库,提供了丰富的代码示例,便于实践操作。
154 64
|
1天前
|
SQL 数据可视化 数据挖掘
想让Excel表格设计更美观?试试这几款好用工具!
Excel表格设计在项目管理和数据分析中至关重要。本文推荐四款辅助工具:板栗看板、Excel自动图表助手、Think-Cell Chart 和 Power BI,分别在任务管理、图表生成、数据可视化等方面表现突出,帮助你设计出更专业、美观的表格。
11 2
|
13天前
|
数据处理
在Excel中,通配符是一种强大的工具
【10月更文挑战第23天】在Excel中,通配符是一种强大的工具
15 4
|
15天前
|
机器学习/深度学习 并行计算 数据挖掘
R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域
【10月更文挑战第21天】R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域。本文将介绍R语言中的一些高级编程技巧,包括函数式编程、向量化运算、字符串处理、循环和条件语句、异常处理和性能优化等方面,以帮助读者更好地掌握R语言的编程技巧,提高数据分析的效率。
35 2
|
15天前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
21 2
|
1月前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据分析:从入门到实践
使用Python进行数据分析:从入门到实践
39 2
|
2月前
|
数据挖掘 Python
Pandas实战(3):电商购物用户行为数据分析
Pandas实战(3):电商购物用户行为数据分析
102 1
下一篇
无影云桌面