3星|《数据思维:从数据分析到商业价值》:有趣的数据分析案例

简介:

数据思维(从数据分析到商业价值)

全书是公众号“狗熊会”的文章的精选,文章都还比较下功夫,但是集结起来看不够全面系统,有的还略显重复。

书中有一些图表的使用技巧,简单介绍了回归分析和机器学习,还有一部分是中文文本分析的案例。

所有的案例都没提到具体的实现细节,有些是用excel或R画图可以实现的,有些则需要编程处理。

案例比较有意思。

书的装帧不错,图是彩色的看起来比较舒服。数据图表的排版与样式花了些功夫,虽然比不上经济学人的图表,还算可以。

总体评价3星,有一定参考价值。

以下是书中一些内容的摘抄:

1:因为你确立了一个可以量化的参照系,而这个参照系就是客户现有的系统。如果没有这个参照系,又想说明75%的精度是有价值的,是不是无比艰难?P19

2:这就是回归分析要完成的三个使命:识别重要变量;判断相关性的方向;估计权重(回归系数)。P25

3:当一个离散型变量只有两个取值的时候,无论在报告里还是在PPT里,都不建议画饼图,因为很容易画成图2-22的丑样。P54

4:对数变换可谓是画图界的整客神器,专门解决各种不对称分布、非正态分布和异方差现象等问题。P72

5:本案例将最经典的技术分析方法之一——均线策略,运用于中国股票市场。通过本案例可以发现,以时间序列模型为基础的均线策略在中国市场有不错的表现,这证明时间序列分析的有用性。P107

6:这里给大家分享一个竞价分配方案:50%预算购买行业词,30%预算购买主打产品词,20%预算购买长尾词。P204

7:用各角色与梅长苏出现在同一自然段的次数作为亲密度的衡量指标。P210














本文转自左其盛博客园博客,原文链接:    http://www.cnblogs.com/zuoqs/p/7892156.html,如需转载请自行联系原作者







相关文章
|
25天前
|
数据挖掘 PyTorch TensorFlow
|
2月前
|
数据采集 存储 数据挖掘
【优秀python数据分析案例】基于Python书旗网小说网站数据采集与分析的设计与实现
本文介绍了一个基于Python的书旗网小说网站数据采集与分析系统,通过自动化爬虫收集小说数据,利用Pandas进行数据处理,并通过Matplotlib和Seaborn等库进行数据可视化,旨在揭示用户喜好和市场趋势,为图书出版行业提供决策支持。
149 6
【优秀python数据分析案例】基于Python书旗网小说网站数据采集与分析的设计与实现
|
2月前
|
数据采集 DataWorks 数据挖掘
提升数据分析效率:DataWorks在企业级数据治理中的应用
【8月更文第25天】本文将探讨阿里巴巴云的DataWorks平台如何通过建立统一的数据标准、规范以及实现数据质量监控和元数据管理来提高企业的数据分析效率。我们将通过具体的案例研究和技术实践来展示DataWorks如何简化数据处理流程,减少成本,并加速业务决策。
193 54
|
25天前
|
机器学习/深度学习 数据挖掘 TensorFlow
🔍揭秘Python数据分析奥秘,TensorFlow助力解锁数据背后的亿万商机
【9月更文挑战第11天】在信息爆炸的时代,数据如沉睡的宝藏,等待发掘。Python以简洁的语法和丰富的库生态成为数据分析的首选,而TensorFlow则为深度学习赋能,助你洞察数据核心,解锁商机。通过Pandas库,我们可以轻松处理结构化数据,进行统计分析和可视化;TensorFlow则能构建复杂的神经网络模型,捕捉非线性关系,提升预测准确性。两者的结合,让你在商业竞争中脱颖而出,把握市场脉搏,释放数据的无限价值。以下是使用Pandas进行简单数据分析的示例:
32 5
|
2月前
|
JSON 数据挖掘 API
案例 | 用pdpipe搭建pandas数据分析流水线
案例 | 用pdpipe搭建pandas数据分析流水线
|
2月前
|
存储 数据挖掘 数据处理
DataFrame探索之旅:如何一眼洞察数据本质,提升你的数据分析能力?
【8月更文挑战第22天】本文通过电商用户订单数据的案例,展示了如何使用Python的pandas库查看DataFrame信息。首先导入数据并使用`head()`, `columns`, `shape`, `describe()`, 和 `dtypes` 方法来快速概览数据的基本特征。接着,通过对数据进行分组操作计算每位顾客的平均订单金额,以此展示初步数据分析的过程。掌握这些技能对于高效的数据分析至关重要。
33 2
|
2月前
|
数据采集 机器学习/深度学习 算法
"揭秘数据质量自动化的秘密武器:机器学习模型如何精准捕捉数据中的‘隐形陷阱’,让你的数据分析无懈可击?"
【8月更文挑战第20天】随着大数据成为核心资源,数据质量直接影响机器学习模型的准确性和效果。传统的人工审查方法效率低且易错。本文介绍如何运用机器学习自动化评估数据质量,解决缺失值、异常值等问题,提升模型训练效率和预测准确性。通过Python和scikit-learn示例展示了异常值检测的过程,最后强调在自动化评估的同时结合人工审查的重要性。
57 2
|
26天前
|
机器学习/深度学习 数据挖掘 TensorFlow
从数据小白到AI专家:Python数据分析与TensorFlow/PyTorch深度学习的蜕变之路
【9月更文挑战第10天】从数据新手成长为AI专家,需先掌握Python基础语法,并学会使用NumPy和Pandas进行数据分析。接着,通过Matplotlib和Seaborn实现数据可视化,最后利用TensorFlow或PyTorch探索深度学习。这一过程涉及从数据清洗、可视化到构建神经网络的多个步骤,每一步都需不断实践与学习。借助Python的强大功能及各类库的支持,你能逐步解锁数据的深层价值。
46 0
|
2月前
|
数据采集 数据可视化 算法
GitHub星标68K!Python数据分析入门手册带你从数据获取到可视化
Python作为一门优秀的编程语言,近年来受到很多编程爱好者的青睐。一是因为Python本身具有简捷优美、易学易用的特点;二是由于互联网的飞速发展,我们正迎来大数据的时代,而Python 无论是在数据的采集与处理方面,还是在数据分析与可视化方面都有独特的优势。我们可以利用 Python 便捷地开展与数据相关的项目,以很低的学习成本快速完成项目的研究。
|
2月前
|
供应链 数据可视化 数据挖掘
【python】python省市水资源数据分析可视化(源码+数据)【独一无二】
【python】python省市水资源数据分析可视化(源码+数据)【独一无二】

热门文章

最新文章

下一篇
无影云桌面