《数据科学与大数据分析——数据的发现 分析 可视化与表示》一2.10 练习

简介:

本节书摘来自异步社区《数据科学与大数据分析——数据的发现 分析 可视化与表示》一书中的第2章,第2.10节,作者【美】EMC Education Services(EMC教育服务团队),更多章节内容可以访问云栖社区“异步社区”公众号查看

2.10 练习

1.团队会在哪个阶段花费最多的时间?为什么?团队会在哪个阶段花费最少的时间?

2.在全面推广新的分析方法之前做一个试点项目的好处是什么?

3.以下阶段可能会使用什么样的工具,分别针对哪些类型的应用场景?

  a.阶段2:数据准备

  b.阶段4:模型建立

参考书目
[1] T. H. Davenport and D. J. Patil, “Data Scientist: The Sexiest Job of the 21st Century,” HarvardBusiness Review, October 2012.

[2] J. Manyika, M. Chiu, B. Brown, J. Bughin, R. Dobbs, C. Roxburgh, and A. H. Byers, “Big Data: The NextFrontier for Innovation, Competition, and Productivity,” McKinsey Global Institute, 2011.

[3]“Scientific Method” [Online]. Available: http://en.wikipedia.org/wiki/Scientific_method.

[4]“CRISP-DM” [Online]. Available: http://en.wikipedia.org/wiki/CrossIndustry_Standard Process_for_Data_Mining.

[5] T. H. Davenport, J. G. Harris, and R. Morison, Analytics at Work: Smarter Decisions, Better Results,2010, Harvard Business Review Press.

[6] D. W. Hubbard, How to Measure Anything: Finding the Value of Intangibles in Business, 2010,Hoboken, NJ: John Wiley & Sons.

[7] J. Cohen, B. Dolan, M. Dunlap, J. M. Hellerstein and C. Welton, MAD Skills: New Analysis Practicesfor Big Data, Watertown, MA 2009.

[8]“List of APIs” [Online]. Available: http://www.programmableweb.com/apis.

[9] B. Shneiderman [Online]. Available: http://www.ifp.illinois.edu/nabhcs/abstracts/shneiderman.html.

[10]“Hadoop” [Online]. Available: http://hadoop.apache.org.

[11]“Alpine Miner” [Online]. Available: http://alpinenow.com.

[12]“OpenRefine” [Online]. Available: http://openrefine.org.

[13]“Data Wrangler” [Online]. Available: http://vis.stanford.edu/wrangler/.

[14]“CRAN” [Online]. Available: http://cran.us.r-project.org.

[15]“SQL” [Online]. Available: http://en.wikipedia.org/wiki/SQL.

[16]“SAS/ACCESS” [Online]. Available: http://www.sas.com/en_us/software/data-management/access.htm.

[17]“SAS Enterprise Miner” [Online]. Available: http://www.sas.com/en_us/software/analytics/ enterprise-miner.html.

[18]“SPSS Modeler” [Online]. Available: http://www-03.ibm.com/software/products/en/category/ business-analytics.

[19]“Matlab” [Online]. Available: http://www.mathworks.com/products/matlab/.

[20]“Statistica” [Online]. Available: https://www.statsoft.com.

[21]“Mathematica” [Online]. Available: http://www.wolfram.com/mathematica/.

[22]“Octave” [Online]. Available: https://www.gnu.org/software/octave/.

[23]“WEKA” [Online]. Available: http://www.cs.waikato.ac.nz/ml/weka/.

[24]“MADlib” [Online]. Available: http://madlib.net.

[25] K. L. Higbee, Your Memory—How It Works and How to Improve It, New York: Marlowe &Company, 1996.

[26] S. Todd, “Data Science and Big Data Curriculum” [Online]. Available: http://stevetodd.typepad.com/my_weblog/data-science-and-big-data-curriculum/.

[27] T. H Davenport and D. J. Patil, “Data Scientist: The Sexiest Job of the 21st Century,” HarvardBusiness Review, October 2012.

相关文章
|
机器学习/深度学习 人工智能 算法
「数据分析」精选数据挖掘和机器学习软件列表
「数据分析」精选数据挖掘和机器学习软件列表
|
数据采集 分布式计算 数据可视化
数据分析学习
个人学习
202 0
数据分析学习
|
数据挖掘 Go 数据库
数据分析与数据挖掘研究之一 (下)
数据分析与数据挖掘研究之一
数据分析与数据挖掘研究之一 (下)
|
数据挖掘 数据库 Perl
数据分析与数据挖掘研究之一 (上)
之前做过一些数据分析与数据挖掘相关的工作,最近抽空将之前做的内容简单整理一下,方便查看,主要使用R语言和PERL脚本语言,使用TCGA和ICGC数据库中的临床数据,做类似的分析可以参考一下,如果想查看详细内容与数据可以通过本人的Gitee及Github仓库下载,链接于篇尾附上。
数据分析与数据挖掘研究之一 (上)
|
SQL 数据可视化 数据挖掘
深度讲述6款 “数据分析” 工具,告诉你数据分析应该学这个!
深度讲述6款 “数据分析” 工具,告诉你数据分析应该学这个!
深度讲述6款 “数据分析” 工具,告诉你数据分析应该学这个!
|
分布式计算 数据可视化 大数据
《数据科学与大数据分析——数据的发现 分析 可视化与表示》一导读
本书将介绍大数据分析中从业人员常用的一些关键技术和分析方法。通过掌握这些常用的大数据分析方法,将帮助您胜任大数据分析项目。书中内容会让不同的读者群体受益:业务和数据分析师通过阅读本书,可以学习到很多实用的大数据分析方法;数据库从业人员、商业智能经理、分析师和大数据从业者通过阅读本书可以丰富数据分析技能,大学毕业生通过阅读本书可以了解如何将数据科学做为职业发展领域。
2216 0