全书是公众号“狗熊会”的文章的精选,文章都还比较下功夫,但是集结起来看不够全面系统,有的还略显重复。
书中有一些图表的使用技巧,简单介绍了回归分析和机器学习,还有一部分是中文文本分析的案例。
所有的案例都没提到具体的实现细节,有些是用excel或R画图可以实现的,有些则需要编程处理。
案例比较有意思。
书的装帧不错,图是彩色的看起来比较舒服。数据图表的排版与样式花了些功夫,虽然比不上经济学人的图表,还算可以。
总体评价3星,有一定参考价值。
以下是书中一些内容的摘抄:
1:因为你确立了一个可以量化的参照系,而这个参照系就是客户现有的系统。如果没有这个参照系,又想说明75%的精度是有价值的,是不是无比艰难?P19
2:这就是回归分析要完成的三个使命:识别重要变量;判断相关性的方向;估计权重(回归系数)。P25
3:当一个离散型变量只有两个取值的时候,无论在报告里还是在PPT里,都不建议画饼图,因为很容易画成图2-22的丑样。P54
4:对数变换可谓是画图界的整客神器,专门解决各种不对称分布、非正态分布和异方差现象等问题。P72
5:本案例将最经典的技术分析方法之一——均线策略,运用于中国股票市场。通过本案例可以发现,以时间序列模型为基础的均线策略在中国市场有不错的表现,这证明时间序列分析的有用性。P107
6:这里给大家分享一个竞价分配方案:50%预算购买行业词,30%预算购买主打产品词,20%预算购买长尾词。P204
7:用各角色与梅长苏出现在同一自然段的次数作为亲密度的衡量指标。P210
本文转自左其盛博客园博客,原文链接: http://www.cnblogs.com/zuoqs/p/7892156.html,如需转载请自行联系原作者