《数据科学与大数据分析——数据的发现 分析 可视化与表示》一2.10 练习

简介:

本节书摘来自异步社区《数据科学与大数据分析——数据的发现 分析 可视化与表示》一书中的第2章,第2.10节,作者【美】EMC Education Services(EMC教育服务团队),更多章节内容可以访问云栖社区“异步社区”公众号查看

2.10 练习

1.团队会在哪个阶段花费最多的时间?为什么?团队会在哪个阶段花费最少的时间?

2.在全面推广新的分析方法之前做一个试点项目的好处是什么?

3.以下阶段可能会使用什么样的工具,分别针对哪些类型的应用场景?

  a.阶段2:数据准备

  b.阶段4:模型建立

参考书目
[1] T. H. Davenport and D. J. Patil, “Data Scientist: The Sexiest Job of the 21st Century,” HarvardBusiness Review, October 2012.

[2] J. Manyika, M. Chiu, B. Brown, J. Bughin, R. Dobbs, C. Roxburgh, and A. H. Byers, “Big Data: The NextFrontier for Innovation, Competition, and Productivity,” McKinsey Global Institute, 2011.

[3]“Scientific Method” [Online]. Available: http://en.wikipedia.org/wiki/Scientific_method.

[4]“CRISP-DM” [Online]. Available: http://en.wikipedia.org/wiki/CrossIndustry_Standard Process_for_Data_Mining.

[5] T. H. Davenport, J. G. Harris, and R. Morison, Analytics at Work: Smarter Decisions, Better Results,2010, Harvard Business Review Press.

[6] D. W. Hubbard, How to Measure Anything: Finding the Value of Intangibles in Business, 2010,Hoboken, NJ: John Wiley & Sons.

[7] J. Cohen, B. Dolan, M. Dunlap, J. M. Hellerstein and C. Welton, MAD Skills: New Analysis Practicesfor Big Data, Watertown, MA 2009.

[8]“List of APIs” [Online]. Available: http://www.programmableweb.com/apis.

[9] B. Shneiderman [Online]. Available: http://www.ifp.illinois.edu/nabhcs/abstracts/shneiderman.html.

[10]“Hadoop” [Online]. Available: http://hadoop.apache.org.

[11]“Alpine Miner” [Online]. Available: http://alpinenow.com.

[12]“OpenRefine” [Online]. Available: http://openrefine.org.

[13]“Data Wrangler” [Online]. Available: http://vis.stanford.edu/wrangler/.

[14]“CRAN” [Online]. Available: http://cran.us.r-project.org.

[15]“SQL” [Online]. Available: http://en.wikipedia.org/wiki/SQL.

[16]“SAS/ACCESS” [Online]. Available: http://www.sas.com/en_us/software/data-management/access.htm.

[17]“SAS Enterprise Miner” [Online]. Available: http://www.sas.com/en_us/software/analytics/ enterprise-miner.html.

[18]“SPSS Modeler” [Online]. Available: http://www-03.ibm.com/software/products/en/category/ business-analytics.

[19]“Matlab” [Online]. Available: http://www.mathworks.com/products/matlab/.

[20]“Statistica” [Online]. Available: https://www.statsoft.com.

[21]“Mathematica” [Online]. Available: http://www.wolfram.com/mathematica/.

[22]“Octave” [Online]. Available: https://www.gnu.org/software/octave/.

[23]“WEKA” [Online]. Available: http://www.cs.waikato.ac.nz/ml/weka/.

[24]“MADlib” [Online]. Available: http://madlib.net.

[25] K. L. Higbee, Your Memory—How It Works and How to Improve It, New York: Marlowe &Company, 1996.

[26] S. Todd, “Data Science and Big Data Curriculum” [Online]. Available: http://stevetodd.typepad.com/my_weblog/data-science-and-big-data-curriculum/.

[27] T. H Davenport and D. J. Patil, “Data Scientist: The Sexiest Job of the 21st Century,” HarvardBusiness Review, October 2012.

相关文章
|
3月前
|
机器学习/深度学习 并行计算 数据挖掘
R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域
【10月更文挑战第21天】R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域。本文将介绍R语言中的一些高级编程技巧,包括函数式编程、向量化运算、字符串处理、循环和条件语句、异常处理和性能优化等方面,以帮助读者更好地掌握R语言的编程技巧,提高数据分析的效率。
75 2
|
8月前
|
机器学习/深度学习 算法 数据挖掘
数据分析入门系列教程-股票走势预测分析
数据分析入门系列教程-股票走势预测分析
124 0
数据分析入门系列教程-股票走势预测分析
|
数据采集 分布式计算 数据可视化
数据分析学习
个人学习
214 0
数据分析学习
|
机器学习/深度学习 数据采集 算法
|
JSON JavaScript 前端开发
数据科学的原理与技巧 五、探索性数据分析
五、探索性数据分析 原文:DS-100/textbook/notebooks/ch05 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 探索性数据分析是一种态度,一种灵活的状态,一种寻找那些我们认为不存在和存在的东西的心愿。
1095 0
|
人工智能 物联网 数据挖掘
非数据科学家如何进行数据分析?
文章讲的是非数据科学家如何进行数据分析,Gartner报告称,到2018年,大多数业务人员和分析师都将通过自助式BI工具来准备和分析大数据。虽然目前国内的发展现状无法在2018年达到自助式分析的局面,但这一趋势无法否认。
1247 0
|
分布式计算 数据可视化 大数据
《数据科学与大数据分析——数据的发现 分析 可视化与表示》一导读
本书将介绍大数据分析中从业人员常用的一些关键技术和分析方法。通过掌握这些常用的大数据分析方法,将帮助您胜任大数据分析项目。书中内容会让不同的读者群体受益:业务和数据分析师通过阅读本书,可以学习到很多实用的大数据分析方法;数据库从业人员、商业智能经理、分析师和大数据从业者通过阅读本书可以丰富数据分析技能,大学毕业生通过阅读本书可以了解如何将数据科学做为职业发展领域。
2245 0