【人工智能】机器学习工具总览

简介: 【人工智能】机器学习工具总览


丰富的机器学习工具

当谈到训练计算机在没有明确编程的情况下采取行动时,存在大量来自机器学习领域的工具。学术界和行业专业人士使用这些工具在MRI扫描中构建从语音识别到癌症检测的多种应用。这些工具可在网上免费获得。如果您感兴趣,我已经编制了这些的排名(请参阅本页底部)以及一些区分它们的重要功能的概述。其中,从主页网站获取每种工具的描述,关注机器学习中的特定范例以及学术界和工业界的一些显着用途。

研究人员可以一次使用许多不同的库,编写自己的库,或者不引用任何特定的工具,因此很难量化每种库的相对采用。相反,搜索排名反映了5月份谷歌搜索每个工具的相对大小。该分数并不反映广泛采用,但为我们提供了一个很好的指示,表明正在使用哪些。注意*像“Caffe”这样的模糊名称被评为“Caffe机器学习”,不那么含糊。


机器学习工具总览

我已经将两个机器学习子领域Deep和Shallow Learning区分开来,这已成为过去几年中的一个重要分支。深度学习负责图像分类和语音识别的记录结果,因此由Google,Facebook和百度等大型数据公司牵头。相反,浅层学习方法包括各种不太前沿的分类,聚类和提升技术,如支持向量机。浅层学习方法仍然广泛应用于自然语言处理,脑计算机接口和信息检索等领域。

机器学习包和库的详细比较

此表还包含有关使用GPU的特定工具支持的信息。GPU接口已经成为机器学习工具的一个重要特性,因为它可以加速大规模矩阵运算。这对深度学习方法的重要性是显而易见的。例如,在2015年5月初的GPU技术大会上,机器学习下的45个演讲中有39个是关于GPU加速的深度学习应用程序,这些应用程序来自31家主要的科技公司和8所大学。这一吸引力反映了Deep Networks对GPU辅助培训的巨大速度提升,因此是一项重要功能。

还提供了有关通过Hadoop或Spark在集群中分配计算的工具能力的信息。这已成为适合分布式计算的浅学习技术的重要论述点。同样,Deep Networks的分布式计算也成为一个讨论点,因为已经为分布式训练算法开发了新技术。

最后,附上一些关于学术界和工业界对这些工具的不同使用的补充说明。通过搜索机器学习出版物,演示文稿和分布式代码收集了哪些信息。

这项研究的结果表明,目前有许多工具正在使用,目前还不确定哪种工具能够赢得狮子会在工业界或学术界的使用份额。


Search Rank Tool Language Type

Description

“quote”

Use GPU acceleration Distributed computing
100 Theano Python Library umerical computation library for multi-dimensional arrays efficiently Deep and shallow Learning CUDA and Open CL cuDNN    Cutorch
78 Torch 7 Lua Framework Scientific computing framework with wide support for machine learning algorithms Deep and shallow Learning CUDA and Open CL, cuDNN Cutorch
64 R R Environment/ Language Functional language and environment for statistics Shallow Learning
RPUD
HiPLAR
52 LIBSVM Java and C++ Library A Library for Support Vector Machines Support Vector Machines CUDA Not Yet
34 scikit-learn Python Library Machine Learning in Python Shallow Learning Not Yet Not Yet
28

Spark

MLLIB

C++, APIs in JAVA, and Python Library/API Apache Spark’s scalable machine learning library Shallow Learning ScalaCL

Spark and

Hadoop

24 Matlab Matlab Environment/ Language High-level technical computing language and interactive environment for algorithm development, data visualization, data analysis, and numerical analysis Deep and Shallow Learning Parallel Computing Toolbox (not-free not-open source)

Distributed Computing

Package (not-free not-open source)

18 Pylearn2 Python Library Machine Learning Deep Learning CUDA and OpenCL, cuDNN Not Yet
14

VowPal

Wabbit

C++ Library Out-of-core learning system Shallow Learning CUDA Not Yet
13 Caffe C++ Framework Deep learning framework made with expression, speed, and modularity in mind Deep Learning CUDA and OpenCL, cuDNN Not Yet
11 LIBLINEAR Java and C++ Library A Library for Large Linear Classification Support Vector Machines and Logistic Regression CUDA Not Yet
6 Mahout Java Environment/ Framework An environment for building scalable algorithms Shallow Learning JCUDA Spark andHadoop
5

Accord.

NET

.Net Framework Machine learning Deep and Shallow Learning CUDA.net Not Yet
5 NLTK Python Library Programs to work with human language data Text Classification Skits.cuda Not Yet
4

Deep

learning4j

Java Framework Commercial-grade, open-source, distributed deep-learning library Deep and shallow Learning JClubas Spark andHadoop
4 Weka 3 Java Library Collection of machine learning algorithms for data mining tasks Shallow Learning Not Yet

Distributed

Weka Spark

4 MLPY Python Library Machine Learning Shallow Learning Skits.cuda Not Yet
3 Pandas Python Library Data analysis and manipulation Shallow Learning Skits.cuda Not Yet
1 H20 Java, Python and R Environment/ Language open source predictive analytics platform Deep and Shallow Learning Not Yet Spark and Hadoop
0 Cuda-covnet C++ Library machine learning library forneural-network applications Deep Neural Networks CUDA coming in Cuda-covnet2
0 Mallet Java Library Package for statistical natural language processing Shallow Learning JCUDA Spark and Hadoop
0 JSAT Java Library Statistical Analysis Tool Shallow Learning JCUDA Spark and Hadoop
0 MultiBoost C++ Library Machine Learning Boosting Algorithms CUDA Not Yet
0 Shogun C++ Library Machine Learning Shallow Learning CUDA Not Yet
0 MLPACK C++ Library Machine Learning Shallow Learning CUDA Not Yet
0 DLIB C++ Library Machine Learning Shallow Learning CUDA Not Yet
0 Ramp Python Library Machine Learning Shallow Learning Skits.cuda Not Yet
0 Deepnet Python Library GPU-based Machine Learning Deep Learning CUDA Not Yet
0 CUV Python Library GPU-based Machine Learning Deep Learning CUDA Not Yet
0 APRIL-ANN Lua Library Machine Learning Deep Learning Not Yet Not Yet
0 nnForge C++ Framework GPU-basedMachine Learning Convolutionl and fully-connected neural networks CUDA Not Yet
0 PYML Python Framework Object oriented framework for machine learning SVMs and other kernel methods Skits.cuda Not Yet
0 Milk Python Library Machine Learning Shallow Learning Skits.cuda Not Yet
0 MDP Python Library Machine Learning Shallow Learning Skits.cuda Not Yet
0
Orange
Python Library Machine Learning Shallow Learning Skits.cuda Not Yet
0 PYMVPA Python Library Machine Learning Only Classification Skits.cuda Not Yet
0
Monte
Python Library Machine Learning Shallow Learning Skits.cuda Not Yet
0
RPY2
Python to R API Low-level interface to R Shallow Learning Skits.cuda Not Yet
0 NueroLab Python Library Machine Learning Feed Forward Neural Networks Skits.cuda Not Yet
0 PythonXX Python Library Machine Learning Shallow Learning Skits.cuda Not Yet
0 Hcluster Python Library Machine Learning Clustering Algorithms Skits.cuda Not Yet
0 FYANN C Library Machine Learning Feed Forward Neural Networks Not Yet Not Yet
0 PyANN Python Library Machine Learning Nearest Neighbours Classification Not Yet Not Yet
0 FFNET Python Library Machine Learning FeedForwad NeuralNetwors Not Yet Not Yet


相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
4月前
|
机器学习/深度学习 人工智能 测试技术
EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读
EdgeMark是一个面向嵌入式AI的自动化部署与基准测试系统,支持TensorFlow Lite Micro、Edge Impulse等主流工具,通过模块化架构实现模型生成、优化、转换与部署全流程自动化,并提供跨平台性能对比,助力开发者在资源受限设备上高效选择与部署AI模型。
424 9
EdgeMark:嵌入式人工智能工具的自动化与基准测试系统——论文阅读
|
3月前
|
人工智能 并行计算 PyTorch
以Lama Cleaner的AI去水印工具理解人工智能中经常会用到GPU来计算的CUDA是什么? 优雅草-卓伊凡
以Lama Cleaner的AI去水印工具理解人工智能中经常会用到GPU来计算的CUDA是什么? 优雅草-卓伊凡
296 4
|
机器学习/深度学习 人工智能 物联网
通义灵码在人工智能与机器学习领域的应用
通义灵码不仅在物联网领域表现出色,还在人工智能、机器学习、金融、医疗和教育等领域展现出广泛应用前景。本文探讨了其在这些领域的具体应用,如模型训练、风险评估、医疗影像诊断等,并总结了其提高开发效率、降低门槛、促进合作和推动创新的优势。
通义灵码在人工智能与机器学习领域的应用
|
8月前
|
数据可视化 Rust 机器学习/深度学习
mlop.ai 无脑使用教程 (机器学习工具 WandB/ClearML 的首个国区开源平替)
mlop.ai 是首个为国区用户优化的机器学习工具,全栈免费开源,是主流付费解决方案 ClearML/WandB 的开源平替。常规实验追踪的工具经常大幅人为降速,mlop因为底层为Rust代码,能轻松支持高频数据写入。如需更多开发者帮助或企业支持,敬请联系cn@mlop.ai
458 12
mlop.ai 无脑使用教程 (机器学习工具 WandB/ClearML 的首个国区开源平替)
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与机器学习:探索未来的技术边界
【10月更文挑战第18天】 在这篇文章中,我们将深入探讨人工智能(AI)和机器学习(ML)的基础知识、应用领域以及未来趋势。通过对比分析,我们将揭示这些技术如何改变我们的生活和工作方式,并预测它们在未来可能带来的影响。文章旨在为读者提供一个全面而深入的理解,帮助他们更好地把握这一领域的发展趋势。
|
人工智能 自然语言处理 算法
打破AI信息差:2024年20款好用的人工智能工具大盘点
本文带你了解20款值得一试的AI工具,帮助你在内容创作、图像设计、音频视频编辑等领域提高效率、激发创意。
1805 1
打破AI信息差:2024年20款好用的人工智能工具大盘点
|
机器学习/深度学习 传感器 人工智能
人工智能与机器学习:改变未来的力量####
【10月更文挑战第21天】 在本文中,我们将深入探讨人工智能(AI)和机器学习(ML)的基本概念、发展历程及其在未来可能带来的革命性变化。通过分析当前最前沿的技术和应用案例,揭示AI和ML如何正在重塑各行各业,并展望它们在未来十年的潜在影响。 ####
328 27
|
机器学习/深度学习 人工智能 算法
人工智能浪潮下的编程实践:构建你的第一个机器学习模型
在人工智能的巨浪中,每个人都有机会成为弄潮儿。本文将带你一探究竟,从零基础开始,用最易懂的语言和步骤,教你如何构建属于自己的第一个机器学习模型。不需要复杂的数学公式,也不必担心编程难题,只需跟随我们的步伐,一起探索这个充满魔力的AI世界。
270 12
|
机器学习/深度学习 人工智能 算法
探索人工智能与机器学习的融合之路
在本文中,我们将探讨人工智能(AI)与机器学习(ML)之间的紧密联系以及它们如何共同推动技术革新。我们将深入分析这两种技术的基本概念、发展历程和当前的应用趋势,同时讨论它们面临的挑战和未来的发展方向。通过具体案例研究,我们旨在揭示AI与ML结合的强大潜力,以及这种结合如何为各行各业带来革命性的变化。
289 11
|
机器学习/深度学习 Python
机器学习中评估模型性能的重要工具——混淆矩阵和ROC曲线。混淆矩阵通过真正例、假正例等指标展示模型预测情况
本文介绍了机器学习中评估模型性能的重要工具——混淆矩阵和ROC曲线。混淆矩阵通过真正例、假正例等指标展示模型预测情况,而ROC曲线则通过假正率和真正率评估二分类模型性能。文章还提供了Python中的具体实现示例,展示了如何计算和使用这两种工具来评估模型。
634 8