图解数据分析 | 数据分析工具地图

简介: 基于数据分析目前良好的发展前景,各界也出现了许多好用的功能种类丰富的数据分析工具。本文列举其中的一些常用工具:Python、R、SQL、SAS、Tableau、Excel等。

ShowMeAI研究中心

作者:韩信子@ShowMeAI
教程地址http://www.showmeai.tech/tutorials/33
本文地址http://www.showmeai.tech/article-detail/140
声明:版权所有,转载请联系平台与作者并注明出处

基于数据分析目前良好的发展前景,各界也出现了许多好用的功能种类丰富的数据分析工具。列举其中的一些(本系列教程将聚焦于Python,讲解如何使用Python完成全链条的数据分析过程):

一、Python

Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言,广泛应用于IT互联网各个领域,而近年的大数据与人工智能,机器学习/深度学习,整个生态最活跃支持度最高的编程语言也是Python。

下方是 Python速查表 主要内容:

  • 变量与数据类型
  • 字符串
  • 列表
  • Numpy数组
  • 容器
  • 流程控制
  • 字典/列表推导式
  • 遍历
  • 函数定义
  • 正则表达式

二、SQL

结构化查询语言(Structured Query Language)简称SQL,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。

结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统, 可以使用相同的结构化查询语言作为数据输入与管理的接口。结构化查询语言语句可以嵌套,这使它具有极大的灵活性和强大的功能。下方是速查表主要内容:

  • 基本查询 Basic Queries
  • 连接 join
  • 更新关联接查询 join queries
  • 半连接 semi join
  • 工具函数 utility functions
  • 数据修改 data modification
  • 索引 indexes
  • 报表 Reporting
  • 视图 view

三、R

R非常适用于统计和数据建模,快捷方便、易于上手。R可以在UNIX、Windows和Mac OS等各种平台上编译和运行,还提供了根据用户要求自动安装所有软件包的工具。下方是数据分析常用R库:

方向 R库
数据处理 lubridata,dplyr,ply,reshape2,string,formatR,mcmc
统计 方差分析 aov anova
密度分析 density
假设检验 t.test,prop.test,anova,aov
线性混合模型 lme
机器学习 nnet,rpart,gbm,kernlab,mboost,randomForest,tree,party,lars,boost,e1071,BayesTree,gafit,arules
聚类分析 基于划分的方法 kmeans,pam,park,clara
基于层次的方法 hclust,pvclust,agnes,diana
基于模型的方法 mclust
基于密度的方法 dbscan
分类 决策树 rpart,ctree
随机森林 forest,randomForest
回归 Logistic,Poisson,glm,predict,residuals

四、Excel

Microsoft Excel是数据分析中使用最广泛的工具之一,常用函数、数据透视表、VLookUp、图表制作等功能也频繁被用于数据的预览、整理和分析。

五、Tableau

Tableau有个人免费版本,可连接到任何数据源(例如Excel、公司数据仓库等),然后通过网络实时更新创建可视化效果、地图、仪表板等。

六、Apache Spark

最大的大型数据处理引擎之一,该工具在Hadoop集群中执行应用程序的内存速度快100倍,磁盘速度快10倍,该工具在数据管道和机器学习模型开发中也很流行。

七、SAS

SAS是用于数据处理和分析的编程语言和环境,该工具易于访问,并且可以分析来自不同来源的数据。

资料与代码下载

本教程系列的代码可以在ShowMeAI对应的 github 中下载,可本地python环境运行。能访问Google的宝宝也可以直接借助google colab一键运行与交互操作学习哦!

本系列教程涉及的速查表可以在以下地址下载获取:

拓展参考资料

ShowMeAI相关文章推荐

ShowMeAI系列教程推荐

showmeai

目录
相关文章
|
1月前
|
监控 数据可视化 数据挖掘
数据看板制作工具评测:这6款工具能如何提升企业的数据分析效率?
本文介绍了6款数据看板制作工具,包括板栗看板、Tableau、Power BI、Qlik Sense、Google Data Studio和Looker,从功能、适用场景等方面进行了详细对比,旨在帮助企业选择最合适的工具以实现高效的数据可视化和管理决策。
|
2月前
|
数据挖掘 关系型数据库 Serverless
利用数据分析工具评估特定业务场景下扩缩容操作对性能的影响
通过以上数据分析工具的运用,可以深入挖掘数据背后的信息,准确评估特定业务场景下扩缩容操作对 PolarDB Serverless 性能的影响。同时,这些分析结果还可以为后续的优化和决策提供有力的支持,确保业务系统在不断变化的环境中保持良好的性能表现。
37 2
|
3月前
|
机器学习/深度学习 并行计算 数据挖掘
R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域
【10月更文挑战第21天】R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域。本文将介绍R语言中的一些高级编程技巧,包括函数式编程、向量化运算、字符串处理、循环和条件语句、异常处理和性能优化等方面,以帮助读者更好地掌握R语言的编程技巧,提高数据分析的效率。
69 2
|
3月前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
64 2
|
7月前
|
文字识别 算法 数据挖掘
视觉智能开放平台产品使用合集之对于统计研究和数据分析,有哪些比较好的工具推荐
视觉智能开放平台是指提供一系列基于视觉识别技术的API和服务的平台,这些服务通常包括图像识别、人脸识别、物体检测、文字识别、场景理解等。企业或开发者可以通过调用这些API,快速将视觉智能功能集成到自己的应用或服务中,而无需从零开始研发相关算法和技术。以下是一些常见的视觉智能开放平台产品及其应用场景的概览。
|
8月前
|
数据可视化 数据挖掘 BI
数据分析工具
【5月更文挑战第17天】数据分析工具
76 6
|
6月前
|
机器学习/深度学习 数据可视化 数据挖掘
Python数据分析工具有哪些
【7月更文挑战第3天】Python数据分析工具有哪些
194 58
|
5月前
|
SQL 数据挖掘 关系型数据库
SQL中的聚合函数:数据分析的强大工具
【8月更文挑战第31天】
191 0
|
6月前
|
人工智能 数据挖掘 Python
提升办公生产力工具——AI数据分析应用小浣熊
办公小浣熊广泛应用于日常数据分析、财务分析、商业分析、销售预测、市场分析等多个领域,为用户提供了强大的支持。
提升办公生产力工具——AI数据分析应用小浣熊
|
6月前
|
数据挖掘 大数据 Linux
探索Linux中的snice命令:一个虚构但启发性的数据分析工具
`snice`是一个想象中的Linux命令,用于低优先级地从大数据集中抽样数据。它结合`nice`和`sampling`,支持多种抽样策略,如随机和分层。参数包括指定样本数、策略、输入输出文件和进程优先级。示例:`snice -n 1000 -s random -i large_log.txt -o sample_log.txt`。使用时注意资源管理、数据完整性及权限,并与其它工具结合使用。虽然虚构,但体现了Linux工具在数据分析中的潜力。

热门文章

最新文章