一位数据科学家的私房工具清单
作为一位万人敬仰的数据科学家,不但需要培育一棵参天技能树,私人武器库里没有一票玩得转的大火力工具也是没法在江湖中呼风唤雨的。
近日北卡来罗纳大学CTO,一位数据科学家Jefferson Heard分享了多年来收集沉淀的数据分析工具集:
处理较大、较复杂的类excel数据
Pandas -处理tabular(类似Excel)数据的通用工具套件
SQLite – Tabular数据库格式,能够处...
查看全文 >>
《Python数据挖掘:概念、方法与实践》——1.5节小结
本节书摘来自华章社区《Python数据挖掘:概念、方法与实践》一书中的第1章,第1.5节小结,作者[美] 梅甘·斯夸尔(Megan Squire),更多章节内容可以访问云栖社区“华章社区”公众号查看
1.5 小结在本章中,我们学习了将数据挖掘工具箱扩展到大师级别所需要做的工作。首先,我们从作为数据库知识发现(KDD)过程一部分的数据挖掘历史开始,对该领域进行了全面的介绍。还比较了数据挖掘其他类似...
查看全文 >>
《Python数据挖掘:概念、方法与实践》一1.5 小结
本节书摘来自华章出版社《Python数据挖掘:概念、方法与实践》一书中的第1章,第1.5节,作者[美] 梅甘·斯夸尔(Megan Squire),更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.5 小结
在本章中,我们学习了将数据挖掘工具箱扩展到大师级别所需要做的工作。首先,我们从作为数据库知识发现(KDD)过程一部分的数据挖掘历史开始,对该领域进行了全面的介绍。还比较了数据挖...
查看全文 >>
《python 与数据挖掘 》一 1.2 工具简介
本节书摘来自华章出版社《python 与数据挖掘 》一书中的第1章,第1.2节,作者张良均 杨海宏 何子健 杨 征,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.2 工具简介
数据挖掘软件的历史并不长,甚至连“数据挖掘”这个术语也是在19世纪90年代中期才正式被提出。如今,商用数据挖掘软件和开源工具都已经非常成熟,不仅提供易用的可视化界面,还集成了数据处理、建模、评估等一整套功能。...
查看全文 >>
利用python做数据分析 札记(一)
因为自己对商业非常感兴趣,最近听了好多关大数据、BI等数据挖掘的讲座,很感兴趣,结合自己的技术背景与兴趣,志在讲自己的后半生布道在python,大数据、数据挖掘的路上。
故心血来潮的想回顾一下python,并自学一下python的数据挖掘功能,作为笔记供自己参考并分享给大家。
因为工作的关系之前一直用eclipse做python的IDE开发环境,最近潜心数据挖掘,发现好多任用IPython和...
查看全文 >>
Python VS R语言?数据分析与挖掘该选哪一个?
什么是R语言?
R语言,一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。R本来是由来自新西兰奥克兰大学的罗斯·伊哈卡和罗伯特·杰特曼开发(也因此称为R),现在由“R开发核心团队”负责开发。R基于S语言的一个GNU计划项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行。R的语法是来自Scheme。
R的源代码可自由下载使用,亦有已编译的可执...
查看全文 >>
《python 与数据挖掘 》一 1.2 工具简介
本节书摘来自华章出版社《python 与数据挖掘 》一书中的第1章,第1.2节,作者张良均 杨海宏 何子健 杨 征,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.2 工具简介
数据挖掘软件的历史并不长,甚至连“数据挖掘”这个术语也是在19世纪90年代中期才正式被提出。如今,商用数据挖掘软件和开源工具都已经非常成熟,不仅提供易用的可视化界面,还集成了数据处理、建模、评估等一整套功能。...
查看全文 >>
《Python数据分析与挖掘实战》一2.5 小结
本节书摘来自华章出版社《Python数据分析与挖掘实战》一书中的第2章,第2.5节,作者 张良均 王路 谭立云 苏剑林,更多章节内容可以访问云栖社区“华章计算机”公众号查看
2.5 小结
本章主要对Python进行简单介绍,包括软件安装、使用入门及相关注意事项和Python数据分析及挖掘相关工具箱。由于Python包含多个领域的扩展库,而且扩展库的功能也相当丰富,本章只介绍与数据分析及数据挖掘...
查看全文 >>
《Python数据挖掘:概念、方法与实践》——1.4节如何建立数据挖掘工作环境
本节书摘来自华章社区《Python数据挖掘:概念、方法与实践》一书中的第1章,第1.4节如何建立数据挖掘工作环境,作者[美] 梅甘·斯夸尔(Megan Squire),更多章节内容可以访问云栖社区“华章社区”公众号查看
1.4 如何建立数据挖掘工作环境前面几节帮助我们更好地了解了将要从事的项目及原因。现在可以开始建立一个开发环境,支持所有项目工作了。由于本书的目的是介绍如何构建挖掘数据模式的软件...
查看全文 >>
想用R和Python做文本挖掘又不知如何下手?方法来了!
1、对文章产生好奇
在数据科学中,几乎做所有事情的第一步都是产生好奇,文本挖掘也不例外。
文本挖掘应用领域无比广泛,可以与电影台本、歌词、聊天记录等产生奇妙的化学反应:如南方公园的对话,电影对白的文本挖掘和分析等也都是受到了文本挖掘的启发;近期大数据文摘相关文章《从恋爱到婚后的短信词频图发生了这些变化,你中了几枪?》带各位分析了聊天记录中隐藏的文本信息;而对各类歌词的文本信息分析,也颇有意思。...
查看全文 >>