Python赶超R语言,成为数据科学、机器学习平台中最热门的语言?

简介: 近日,kdnuggets做了一个关于数据科学、机器学习语言使用情况的问卷调查,他们分析了954个回答,得出结论——Python已经打败R语言,成为分析、数据科学和机器学习平台中使用频率最高的语言。

近日,kdnuggets做了一个关于数据科学、机器学习语言使用情况的问卷调查,他们分析了954个回答,得出结论——Python已经打败R语言,成为分析、数据科学和机器学习平台中使用频率最高的语言。有关此次问卷更具体的情况如何?雷锋网(公众号:雷锋网) AI科技评论将kdnuggets上发表的总结文编译整理如下:

之前我们在kdnuggets上做了这样一个问卷调查,2016、2017两年,在分析、数据科学和机器学习的工作中,你用R语言,还是Python,或两者都用,或选择其他的语言?

通过分析954个回答,我们得出了这样的结论:虽然Python并没有完全取代R语言,但在2017年,Python已经成功打败R语言,成为分析、数据科学和机器学习平台中使用频率最高的语言。

在2016年Python还是第二位(主要用Python的人占34%,主要用R语言的人占42%),在2017年Python就以5%的优势领先于R语言(主要用Python的人占41%,主要用R语言的人占36%)。同时用Python和R两种语言的人也从2016年的8.5%增长到12%了,而用其他语言的人则从16%降到11%。

Python赶超R语言,成为数据科学、机器学习平台中最热门的语言?

图1:2016-2017年,在分析、数据科学和机器学习中使用Python、R语言、Python和R语言、其他语言的占比

之后,我们分析了大家在不同语言之间的转换情况。

Python赶超R语言,成为数据科学、机器学习平台中最热门的语言?

图2:2016-2017年,分析、数据科学以及机器学习平台中各种语言的转换情况

这张图看起来很复杂,不过从中可以很容易地看出Python在忠诚度和转换率两个关键层面都领先于其他语言。

  • 忠诚度:使用Python的用户对它的忠诚度要高于使用其他语言的用户。2016年使用Python的用户中,有91%的人2017年还在继续使用它,而R语言的用户留存率为74%,其他语言的用户留存率则为60%。

  • 转换率:从2016年到2017年,只有5%的Python用户转向R语言,而R语言用户转向Python的则是10%,这是前者的两倍。另外,2016年同时使用两种语言的人中,只有49%的人还在继续使用这两种语言,38%的人转向Python,11%的人转向R语言。

接下来我们看一下2014-2017年这几种语言的使用趋势。

因为我们2015年【R vs Python】的问卷调查中没有提供【同时使用两种语言】这个选项,因此下面2014-2016这四年的对比趋势图中,2016、2017年的Python、R语言使用趋势我们是这样计算的:

Python*= (Python的比例) + 50% * (同时使用Python和R语言的比例)

R* = (R的比例) + 50% * (同时使用Python和R语言的比例)

可以看到,R语言的使用率在逐年缓慢下降(从2015年的50%降到2017年的36%),而Python的使用率则从2014年的23%增长到2017年的47%。另外,其他语言的使用率也在逐年下降。

Python赶超R语言,成为数据科学、机器学习平台中最热门的语言?

图3:2014-2017年,Python、R语言及其他语言在分析、数据科学和机器学习的使用情况对比

最后,我们也按地区分析了几种语言的使用趋势,地区分布情况如下:

  • 美国/加拿大,40%

  • 欧洲,35%

  • 亚洲,12.5%

  • 拉美,6.2%

  • 非洲/中东,3.6%

  • 澳洲/新西兰,3.1%

为了简化对比图,我们将同时使用R语言和Python的比例也按照上面的计算方法折算到单独使用R语言和Python的比例中,并把亚洲、澳洲/新西兰、拉美、非洲/中东这四个占比较少的地区合并为一个区域。

Python赶超R语言,成为数据科学、机器学习平台中最热门的语言?

图4:2016-2017年,不同地区使用Python、R语言和其他语言的情况

我们注意到不同区域的语言变化情况:

  • Python的使用率增长了8-10%

  • R语言的使用率降低了大约2-4%

  • 其他语言的使用率降低了5-7%

上面的数据表明了Python的使用前景很好,我们也预测R语言和其他语言的使用率还是会有相当的占比,因为它们已经有很深的用户基础。



本文作者:Non
本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
2月前
|
存储 人工智能 大数据
AI开发新范式,PAI模型构建平台升级发布
本次分享由阿里云智能集团产品专家高慧玲主讲,聚焦AI开发新范式及PAI模型构建平台的升级。分享分为四个部分,围绕“人人可用”和“面向生产”两大核心理念展开。通过降低AI工程化门槛、提供一站式全链路服务,PAI平台致力于帮助企业和开发者更高效地实现AI应用。案例展示中,介绍了多模态模型微调在文旅场景的应用,展示了如何快速复现并利用AI解决实际问题。最终目标是让AI技术更普及,赋能各行业,推动社会进步。
|
2天前
PAI-Rec推荐平台对于实时特征有三个层次
PAI-Rec推荐平台针对实时特征有三个处理层次:1) 离线模拟反推历史请求时刻的实时特征;2) FeatureStore记录增量更新的实时特征,模型特征导出样本准确性达99%;3) 通过callback回调接口记录请求时刻的特征。各层次确保了实时特征的准确性和时效性。
10 0
|
5月前
|
机器学习/深度学习 测试技术
阿里云入选Gartner数据科学和机器学习平台挑战者象限
Gartner® 正式发布了《数据科学与机器学习平台魔力象限》报告(Magic Quadrant™ for Data Science and Machine Learning Platforms),阿里云成为唯一一家入选该报告的中国厂商,被评为“挑战者”(Challengers)。
|
6月前
|
机器学习/深度学习 数据采集 算法
R语言中的机器学习库:caret与mlr的深度解析
【9月更文挑战第2天】Caret和mlr是R语言中两个非常重要的机器学习库,它们在数据预处理、模型构建、调优和评估等方面提供了丰富的功能。Caret以其易用性和集成性著称,适合初学者和快速原型开发;而mlr则以其全面性和可扩展性见长,适合处理复杂的机器学习项目。在实际应用中,用户可以根据具体需求和项目特点选择合适的库进行开发。无论是学术研究、商业智能还是教育场景,这两个库都能为数据科学家和机器学习爱好者提供强大的支持。
|
2月前
|
人工智能 智能设计 数据处理
|
4月前
|
机器学习/深度学习 人工智能 监控
AutoTrain:Hugging Face 开源的无代码模型训练平台
AutoTrain 是 Hugging Face 推出的开源无代码模型训练平台,旨在简化最先进模型的训练过程。用户无需编写代码,只需上传数据即可创建、微调和部署自己的 AI 模型。AutoTrain 支持多种机器学习任务,并提供自动化最佳实践,包括超参数调整、模型验证和分布式训练。
391 4
AutoTrain:Hugging Face 开源的无代码模型训练平台
|
3月前
|
Unix 编译器 C语言
[oeasy]python052_[系统开发语言为什么默认是c语言
本文介绍了C语言为何成为系统开发的首选语言,从其诞生背景、发展历史及特点进行阐述。C语言源于贝尔实验室,与Unix操作系统相互促进,因其简洁、高效、跨平台等特性,逐渐成为主流。文章还提及了C语言的学习资料及其对编程文化的影响。
39 5
|
5月前
|
机器学习/深度学习 数据采集 人工智能
R语言是一种强大的编程语言,广泛应用于统计分析、数据可视化、机器学习等领域
R语言是一种广泛应用于统计分析、数据可视化及机器学习的强大编程语言。本文为初学者提供了一份使用R语言进行机器学习的入门指南,涵盖R语言简介、安装配置、基本操作、常用机器学习库介绍及实例演示,帮助读者快速掌握R语言在机器学习领域的应用。
206 3
|
5月前
|
机器学习/深度学习 并行计算 数据挖掘
R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域
【10月更文挑战第21天】R语言是一种强大的统计分析工具,广泛应用于数据分析和机器学习领域。本文将介绍R语言中的一些高级编程技巧,包括函数式编程、向量化运算、字符串处理、循环和条件语句、异常处理和性能优化等方面,以帮助读者更好地掌握R语言的编程技巧,提高数据分析的效率。
103 2
|
5月前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
132 2

热门文章

最新文章