2013年数据分析、数据挖掘、数据科学使用语言排行榜

简介:  最受欢迎的语言仍然是R( KDnuggets 读者中有61%用户在用),python(39%),SQL(37%).SAS仍然稳定在20%之间。增长最快是:Pig/Hive/Hadoop为基础的语言、R、SQL,同时perl, C/C++, 与Unix 在下降。

 最受欢迎的语言仍然是R( KDnuggets 读者中有61%用户在用),python(39%),SQL(37%).SAS仍然稳定在20%之间。增长最快是:Pig/Hive/Hadoop为基础的语言、R、SQL,同时perl, C/C++, 与Unix 在下降。同时我们发现,R与python用户存在一定的重叠

之前的KDnuggets的调查主要是关注:统计与分析软件,但有时候一个全面与强大的编程语言是需要的。这也是最近一次的KDnuggets调查关注的重点,我们咨询:
在2013年中,什么样的程序或者统计语言你是在做分析、挖掘、科学计算的时候所需要的?
基于超过对700名会员的调查,最受欢迎的仍然是R语言(61%的调研会员在用),python(39%),SQL(37%),平均每个调研对象使用2.3种语言
趋势对比过去二年的调查结果,发现2013的趋势是一样的:

  • 2012年调查:什么样的语言可用于数据分析与数据挖掘。

  • 2011年调查:什么样的语言可用于数据分析与数据挖掘。

· 增长率最高的语言,对比2013 vs 2012是Julia,使用人员增加超过2倍。但仍然是一门小众语言,在2013年也仅有0,7%的用户使用。
· 在比较普通的使用语言中:增加相对较大的语言,对比 2013 vs 2012:
· 以hadoop为基础的语言:Pig Latin/Hive/other,19%的环比增长,从2012年的6.7%增加到2013。
· R,16%的环比增长。
· SQL,14%的增长(SQL的增长是的来源于Hadoop和其它的大数据系统中的SQL接口增长)。

语言的使用份额下降最大的是:

  • Lisp/Clojure, 77% 下降

  • Perl, 50%  下降

  • Ruby, 41%  下降

  • C/C++, 35%  下降

  • Unix shell/awk/sed, 25%  下降

  • Java, 22%  下降

R与PYTHON的使用者是否有重合呢?是的。在使用R语言的13%的用户中,更可能使用python与总体相比要高出13%。下面是哪些语言更可能被R语言用户使用(与总体相比)。

评论:

有一些评论说,比如:指出SPSS也是自己的语法和SAS一样--在下次的调研中,我们将会包括进来。
样本的区域分布为:

  • US/Canada, 50.8%,

  • Europe: 25.7%,

  • Asia: 11.8%,

  • Latin America: 6.7%,

  • AU/NZ: 3.2%,

  • Africa/Middle East: 1.5%


原文发布时间为:2013-08-30

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号
相关文章
|
数据可视化 架构师 数据挖掘
数据分析案例-数据科学相关岗位薪资可视化分析
数据分析案例-数据科学相关岗位薪资可视化分析
526 0
|
数据采集 机器学习/深度学习 数据可视化
数据科学项目实战:完整的Python数据分析流程案例解析
【4月更文挑战第12天】本文以Python为例,展示了数据分析的完整流程:从CSV文件加载数据,执行预处理(处理缺失值和异常值),进行数据探索(可视化和统计分析),选择并训练线性回归模型,评估模型性能,以及结果解释与可视化。每个步骤都包含相关代码示例,强调了数据科学项目中理论与实践的结合。
1691 2
|
机器学习/深度学习 数据采集 数据可视化
Python 数据分析:从零开始构建你的数据科学项目
【10月更文挑战第9天】Python 数据分析:从零开始构建你的数据科学项目
368 2
|
SQL 数据可视化 IDE
SQL做数据分析的困境,查询语言无法回答的真相
SQL 在简单数据分析任务中表现良好,但面对复杂需求时显得力不从心。例如,统计新用户第二天的留存率或连续活跃用户的计算,SQL 需要嵌套子查询和复杂关联,代码冗长难懂。Python 虽更灵活,但仍需变通思路,复杂度较高。相比之下,SPL(Structured Process Language)语法简洁、支持有序计算和分组子集保留,具备强大的交互性和调试功能,适合处理复杂的深度数据分析任务。SPL 已开源免费,是数据分析师的更好选择。
|
供应链 数据可视化 数据挖掘
【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一
本文详细介绍了第十一届泰迪杯数据挖掘挑战赛B题的解决方案,涵盖了对产品订单数据的深入分析、多种因素对需求量影响的探讨,并建立了数学模型进行未来需求量的预测,同时提供了Python代码实现和结果可视化的方法。
658 3
【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题一
|
机器学习/深度学习 数据可视化 数据挖掘
为啥我敢说Python是数据分析界的扛把子语言?
为啥我敢说Python是数据分析界的扛把子语言?
289 1
|
机器学习/深度学习 数据采集 数据挖掘
【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 建模及python代码详解 问题二
本文提供了第十一届泰迪杯数据挖掘挑战赛B题问题二的详细解题步骤,包括时间序列预测模型的建立、多元输入时间预测问题的分析、时间序列预测的建模步骤、改进模型的方法,以及使用Python进行SARIMA模型拟合和预测的具体实现过程。
483 1
|
供应链 算法 数据挖掘
【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 23页论文及实现代码
本文介绍了2023年第十一届泰迪杯数据挖掘挑战赛B题的解决方案,深入分析了产品订单数据,并使用Arimax和Var模型进行了需求预测,旨在为企业供应链管理提供科学依据,论文共23页并包含实现代码。
544 0
【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 23页论文及实现代码
|
机器学习/深度学习 安全 算法
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码
本文总结了2023年第十一届泰迪杯数据挖掘挑战赛A题的新冠疫情防控数据分析,提供了32页和40页的论文以及实现代码,涉及密接者追踪、疫苗接种影响分析、重点场所管控以及疫情趋势研判等多个方面,运用了机器学习算法和SEIR传染病模型等方法。
484 0
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码
|
机器学习/深度学习 安全 算法
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解
本文介绍了2023年第十一届泰迪杯数据挖掘挑战赛A题的解题思路和Python代码实现,涵盖了新冠疫情防控数据的分析、建模方案以及数据治理的具体工作。
439 0
【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解

热门文章

最新文章