2013年数据分析、数据挖掘、数据科学使用语言排行榜

简介:  最受欢迎的语言仍然是R( KDnuggets 读者中有61%用户在用),python(39%),SQL(37%).SAS仍然稳定在20%之间。增长最快是:Pig/Hive/Hadoop为基础的语言、R、SQL,同时perl, C/C++, 与Unix 在下降。
0.jpg

 最受欢迎的语言仍然是R( KDnuggets 读者中有61%用户在用),python(39%),SQL(37%).SAS仍然稳定在20%之间。增长最快是:Pig/Hive/Hadoop为基础的语言、R、SQL,同时perl, C/C++, 与Unix 在下降。同时我们发现,R与python用户存在一定的重叠

之前的KDnuggets的调查主要是关注:统计与分析软件,但有时候一个全面与强大的编程语言是需要的。这也是最近一次的KDnuggets调查关注的重点,我们咨询:
在2013年中,什么样的程序或者统计语言你是在做分析、挖掘、科学计算的时候所需要的?
基于超过对700名会员的调查,最受欢迎的仍然是R语言(61%的调研会员在用),python(39%),SQL(37%),平均每个调研对象使用2.3种语言
趋势对比过去二年的调查结果,发现2013的趋势是一样的:

  • 2012年调查:什么样的语言可用于数据分析与数据挖掘。

  • 2011年调查:什么样的语言可用于数据分析与数据挖掘。

· 增长率最高的语言,对比2013 vs 2012是Julia,使用人员增加超过2倍。但仍然是一门小众语言,在2013年也仅有0,7%的用户使用。
· 在比较普通的使用语言中:增加相对较大的语言,对比 2013 vs 2012:
· 以hadoop为基础的语言:Pig Latin/Hive/other,19%的环比增长,从2012年的6.7%增加到2013。
· R,16%的环比增长。
· SQL,14%的增长(SQL的增长是的来源于Hadoop和其它的大数据系统中的SQL接口增长)。

语言的使用份额下降最大的是:

  • Lisp/Clojure, 77% 下降

  • Perl, 50%  下降

  • Ruby, 41%  下降

  • C/C++, 35%  下降

  • Unix shell/awk/sed, 25%  下降

  • Java, 22%  下降

R与PYTHON的使用者是否有重合呢?是的。在使用R语言的13%的用户中,更可能使用python与总体相比要高出13%。下面是哪些语言更可能被R语言用户使用(与总体相比)。
1.jpg

评论:

有一些评论说,比如:指出SPSS也是自己的语法和SAS一样--在下次的调研中,我们将会包括进来。
样本的区域分布为:

  • US/Canada, 50.8%,

  • Europe: 25.7%,

  • Asia: 11.8%,

  • Latin America: 6.7%,

  • AU/NZ: 3.2%,

  • Africa/Middle East: 1.5%


原文发布时间为:2013-08-30

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号
相关文章
|
2月前
|
数据可视化 架构师 数据挖掘
数据分析案例-数据科学相关岗位薪资可视化分析
数据分析案例-数据科学相关岗位薪资可视化分析
52 0
|
4月前
|
数据可视化 数据挖掘 大数据
【数据挖掘】数据规约中维归约、小波变换、主成分分析的讲解及实战(超详细 附源码)
【数据挖掘】数据规约中维归约、小波变换、主成分分析的讲解及实战(超详细 附源码)
65 0
|
2月前
|
数据采集 数据可视化 数据挖掘
Python数据挖掘项目实战——自动售货机销售数据分析
Python数据挖掘项目实战——自动售货机销售数据分析
|
12天前
|
数据采集 机器学习/深度学习 数据可视化
数据科学面试准备:解决Python数据分析常见问答和挑战
【4月更文挑战第12天】本文介绍了Python数据分析面试中常见的问题和挑战,涉及Pandas、NumPy、Matplotlib等库的基础知识,以及数据预处理、探索性分析、可视化、回归分析和分类分析的方法。例如,使用Pandas处理缺失值和异常值,利用Matplotlib和Seaborn进行数据可视化,通过Scikit-learn进行回归和分类模型的构建。
|
4月前
|
数据可视化 数据挖掘 Python
Python数据挖掘实用案例——自动售货机销售数据分析与应用(二)
Python数据挖掘实用案例——自动售货机销售数据分析与应用(二)
369 0
|
9月前
|
数据采集 数据可视化 安全
台风灾害数据分析与可视化:利用Java和数据科学技术解读台风趋势
台风灾害数据分析与可视化:利用Java和数据科学技术解读台风趋势
|
4月前
|
数据采集 机器学习/深度学习 搜索推荐
数据分析与数据挖掘
数据分析与数据挖掘是两个密切相关但又有区别的概念。 数据分析是指通过收集、处理、分析数据,提取有价值的信息,以便更好地理解数据背后的业务情况和趋势,为决策提供支持。数据分析通常包括描述性统计、探索性数据分析、验证性数据分析和预测性数据分析等步骤。数据分析的应用场景包括:用户行为分析、市场趋势分析、产品性能分析等。
73 8
|
4月前
|
机器学习/深度学习 安全 数据挖掘
Python数据挖掘实用案例——自动售货机销售数据分析与应用(三)
Python数据挖掘实用案例——自动售货机销售数据分析与应用(三)
176 0
|
4月前
|
数据采集 数据可视化 数据挖掘
Python数据挖掘实用案例——自动售货机销售数据分析与应用(一)
Python数据挖掘实用案例——自动售货机销售数据分析与应用
331 0
|
4月前
|
机器学习/深度学习 算法 数据挖掘
数据挖掘:Python数据分析中的高级技术点
数据挖掘:Python数据分析中的高级技术点
80 0