3星|《数据思维:从数据分析到商业价值》:有趣的数据分析案例

简介:

数据思维(从数据分析到商业价值)

全书是公众号“狗熊会”的文章的精选,文章都还比较下功夫,但是集结起来看不够全面系统,有的还略显重复。

书中有一些图表的使用技巧,简单介绍了回归分析和机器学习,还有一部分是中文文本分析的案例。

所有的案例都没提到具体的实现细节,有些是用excel或R画图可以实现的,有些则需要编程处理。

案例比较有意思。

书的装帧不错,图是彩色的看起来比较舒服。数据图表的排版与样式花了些功夫,虽然比不上经济学人的图表,还算可以。

总体评价3星,有一定参考价值。

以下是书中一些内容的摘抄:

1:因为你确立了一个可以量化的参照系,而这个参照系就是客户现有的系统。如果没有这个参照系,又想说明75%的精度是有价值的,是不是无比艰难?P19

2:这就是回归分析要完成的三个使命:识别重要变量;判断相关性的方向;估计权重(回归系数)。P25

3:当一个离散型变量只有两个取值的时候,无论在报告里还是在PPT里,都不建议画饼图,因为很容易画成图2-22的丑样。P54

4:对数变换可谓是画图界的整客神器,专门解决各种不对称分布、非正态分布和异方差现象等问题。P72

5:本案例将最经典的技术分析方法之一——均线策略,运用于中国股票市场。通过本案例可以发现,以时间序列模型为基础的均线策略在中国市场有不错的表现,这证明时间序列分析的有用性。P107

6:这里给大家分享一个竞价分配方案:50%预算购买行业词,30%预算购买主打产品词,20%预算购买长尾词。P204

7:用各角色与梅长苏出现在同一自然段的次数作为亲密度的衡量指标。P210














本文转自左其盛博客园博客,原文链接:    http://www.cnblogs.com/zuoqs/p/7892156.html,如需转载请自行联系原作者







相关文章
|
8天前
|
数据采集 数据可视化 数据挖掘
Pandas数据应用:天气数据分析
本文介绍如何使用 Pandas 进行天气数据分析。Pandas 是一个强大的 Python 数据处理库,适合处理表格型数据。文章涵盖加载天气数据、处理缺失值、转换数据类型、时间序列分析(如滚动平均和重采样)等内容,并解决常见报错如 SettingWithCopyWarning、KeyError 和 TypeError。通过这些方法,帮助用户更好地进行气候趋势预测和决策。
104 71
|
7天前
|
存储 数据采集 数据可视化
Pandas数据应用:电子商务数据分析
本文介绍如何使用 Pandas 进行电子商务数据分析,涵盖数据加载、清洗、预处理、分析与可视化。通过 `read_csv` 等函数加载数据,利用 `info()` 和 `describe()` 探索数据结构和统计信息。针对常见问题如缺失值、重复记录、异常值等,提供解决方案,如 `dropna()`、`drop_duplicates()` 和正则表达式处理。结合 Matplotlib 等库实现数据可视化,探讨内存不足和性能瓶颈的应对方法,并总结常见报错及解决策略,帮助提升电商企业的数据分析能力。
106 73
|
4天前
|
存储 数据采集 数据可视化
Pandas数据应用:医疗数据分析
Pandas是Python中强大的数据操作和分析库,广泛应用于医疗数据分析。本文介绍了使用Pandas进行医疗数据分析的常见问题及解决方案,涵盖数据导入、预处理、清洗、转换、可视化等方面。通过解决文件路径错误、编码不匹配、缺失值处理、异常值识别、分类变量编码等问题,结合Matplotlib等工具实现数据可视化,并提供了解决常见报错的方法。掌握这些技巧可以提高医疗数据分析的效率和准确性。
42 22
|
4月前
|
数据挖掘 PyTorch TensorFlow
|
2月前
|
存储 机器学习/深度学习 数据可视化
数据集中存在大量的重复值,会对后续的数据分析和处理产生什么影响?
数据集中存在大量重复值可能会对后续的数据分析和处理产生多方面的负面影响
130 56
|
9天前
|
数据采集 数据可视化 索引
Pandas数据应用:股票数据分析
本文介绍了如何使用Pandas库进行股票数据分析。首先,通过pip安装并导入Pandas库。接着,从本地CSV文件读取股票数据,并解决常见的解析错误。然后,利用head()、info()等函数查看数据基本信息,进行数据清洗,处理缺失值和重复数据。再者,结合Matplotlib和Seaborn进行数据可视化,绘制收盘价折线图。最后,进行时间序列分析,设置日期索引、重采样和计算移动平均线。通过这些步骤,帮助读者掌握Pandas在股票数据分析中的应用。
40 5
|
15天前
|
机器学习/深度学习 数据采集 DataWorks
数据分析经典案例重现:使用DataWorks Notebook 实现Kaggle竞赛之房价预测,成为数据分析大神!
Python是目前当之无愧的数据分析第一语言,大量的数据科学家使用Python来完成各种各样的数据科学任务。本文以Kaggle竞赛中的房价预测为例,结合DataWorks Notebook,完成数据加载、数据探索、数据可视化、数据清洗、特征分析、特征处理、机器学习、回归预测等步骤,主要Python工具是Pandas和SKLearn。本文中仅仅使用了线性回归这一最基本的机器学习模型,读者可以自行尝试其他更加复杂模型,比如随机森林、支持向量机、XGBoost等。
|
21天前
|
数据采集 监控 数据挖掘
常用电商商品数据API接口(item get)概述,数据分析以及上货
电商商品数据API接口(item get)是电商平台上用于提供商品详细信息的接口。这些接口允许开发者或系统以编程方式获取商品的详细信息,包括但不限于商品的标题、价格、库存、图片、销量、规格参数、用户评价等。这些信息对于电商业务来说至关重要,是商品数据分析、价格监控、上货策略制定等工作的基础。
|
3月前
|
数据采集 机器学习/深度学习 数据可视化
|
3月前
|
机器学习/深度学习 人工智能 搜索推荐
某A保险公司的 数据图表和数据分析
某A保险公司的 数据图表和数据分析
76 0
某A保险公司的 数据图表和数据分析