用于Web开发的5种机器学习框架

简介: 本文讲述了机器学习对Web应用和移动应用在内的软件开发过程产生的重大影响
+关注继续查看

F1.large_.jpg

目前,机器学习是软件开发中最热门的领域之一。甚至许多专家分析,认为机器学习将会彻底改变包括Web应用和移动应用在内的软件开发过程。

以下所列的几个方面可以清楚地说明机器学习对Web开发的重大影响:

· 可以很好的替代传统数据挖掘

· 可以避免安全威胁

· 丰富的机器学习API库

· 加速产品发展

· 生产定制的内容和信息

· 了解用户行为

mc.gif 

机器学习通过一些算法可以在没有显式编程的情况下,让计算机进行自行学习。并且可以找到最优的数据分析方法,自动建立分析模型。这就是为什么机器学习框架在Web开发中起着重要作用的原因。

在本文中,我们将讨论一些主要用于Web开发的机器学习框架。下面会一一进行说明。

5大机器学习框架:

1 Microsoft Cognitive Toolkit

microsoft.jpg 

开发语言:PythonC++

这是一个开源的深度学习工具包,是微软公司专门用来训练算法的,以便让机器像人脑一样学习。通过这个工具,你可以使用各种机器学习模型,如卷积神经网络、前馈DNN和递归神经网络。

毫无疑问,这个工具主要使用神经网络来检查大型非结构化数据集,给开发者提供现成的神经网络代码。它有更短的训练时间和易于使用的体系结构,并且是高度可定制化的,允许选择参数、网络和算法。并且,它支持多机多GPU的后端集群模式。

2TensorFlow

tensorflow.png 

开发语言:PythonJavaGo

TensorFlow是在Java开发中最流行的机器学习框架之一。它是一个开源的库,使用了数据流图进行数值计算,将复杂的数据结构传输至神经网络中进行分析和处理。毫无疑问,TensorFlow是在GitHub上分支最多的机器学习项目,并且也是投资人参与最多的项目。

TensorFlow具有灵活的体系结构,让用户能够很容易地利用单一的API库在一个或多个GPU或CPU上实现分布式计算,而不管是在台式计算机、服务器还是移动电话上。

上图中的节点代表了数值运算,而图的边缘则表示它们之间通信的多维数据集(张量)。TensorFlow为张量从数据流图的一端流动到另一端过程进行计算

3Apache Mahout

Mahout.jpg 

开发语言:Java Scala

这是Apache提供的另一个最流行的源码开放资源库,主要是为统计学专家、数据专家和数学专家而设计的,为了让他们能够更快速、更高效地执行算法操作。另外,它是一种分布式线性代数框架,用于创建具有可扩展性能的机器学习应用。Mahout主要被用于协作分组、过滤和分类几个方面。

此外,它还使你能够在实际运行在大数据平台上的交互式环境中开发自己的数学计算模型,然后可以将相同的程序代码移植到其它应用程序中进行复用。

Mahout Samsara还提供了分布式线性代数以及正在运行的统计引擎,并与交互式Shell和库一起进行分发,以连接到在生产中的应用。利用Apache Hadoop 库,它可以应用map/reduce模式到Apache Hadoop平台,但这并不会对Hadoop上其它那些实现产生影响。

4Caffe 

caffeenew.jpeg 

开发语言:C++Python

Caffe是一个基于Java语言的关于深度学习的框架,特别是针对运行速度、表示能力和模块化几个方面。它是由伯克利大学人工智能研究小组开发的,极具表现力的体系结构更加支持个性化的应用和创新。

另外,Caffe提供的配置选项允许用户通过配置单个指示器在GPU和CPU之间进行无缝切换。它提供的可扩展代码促进了早期的发展,使其成为另一个非常成功的GitHub机器学习项目。

Caffe的速度对研究机构和工业级应用方面做出了很大的贡献。它是利用了卷积神经网络来实现图像分类/计算机视觉的。它还提供了Model Zoo,这是一组预训练的模型,并且不需要任何编码来实现。

应该指出的是,Caffe最适用于应用系统的构造,并且主要应用于计算机视觉领域。

5Apache Singa

singa.jpg 

开发语言:C++PythonJava.

Apache Siga是一个可扩展的、灵活的、用来简化在大数据上训练深度学习模型的开源框架。它是由新加坡国立大学的团队开发的,主要应用于大数据分析领域。该框架为海量数据可扩展的分布式训练提供了一种灵活的体系结构。

Apache Siga在各种各样的硬件上运行都具有可扩展性。它主要应用在自然语言处理(NLP)和图像识别领域。

目前,Apache孵化器项目提供了一种可以在一组节点中工作的简单开发模型。深度分布式学习在训练过程中使用了模型共享和并行化方式,模型可以串行训练,也可以选择并行训练Singa也使用Apache Zookeeper简化了集群的搭建。

不管怎样,Apache Siga也支持传统的机器学习模型,如逻辑回归等等。

结论

我们已经介绍了一些用于Java开发的最好的机器学习框架。事实上,应用了机器学习的Web开发将会使IT世界进行一场革命。然而,目前各种流行的机器学习框架和库不是用Python语言编写的,就是由Python支持的,主要包括Keras、TheanoTensorFlow和一些较小的项目,比如Microsoft Azure Studio、sci-kit learnVeles、Chainer和Neon等等。

 

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

文章原标题《Top 5 Machine Learning Frameworks For Web Development

译者:奥特曼,审校:袁虎

文章为简译,更为详细的内容,请查看原文 

相关文章
|
2月前
|
机器学习/深度学习 算法 TensorFlow
机器学习框架教程:介绍一些流行的机器学习框架(如Scikit-learn、XGBoost等)
机器学习框架教程:介绍一些流行的机器学习框架(如Scikit-learn、XGBoost等)
13 0
|
2月前
|
机器学习/深度学习 数据可视化 PyTorch
PyTorch 与 TensorFlow:机器学习框架之战
PyTorch 与 TensorFlow:机器学习框架之战
105 0
|
3月前
|
机器学习/深度学习 算法 TensorFlow
Python机器学习框架介绍
Python机器学习框架介绍
24 0
|
4月前
|
机器学习/深度学习 PyTorch 算法框架/工具
机器学习框架PyTorch详解和案列分析
PyTorch 是一个基于 Python 的机器学习框架,由 Facebook 于 2016 年发布。它提供了一组灵活且高效的工具,可用于构建和训练各种深度学习模型。PyTorch 的核心组件是张量,它是一个多维数组,可以用于存储和处理数据。PyTorch 的张量与 NumPy 的数组类似,但也提供了 GPU 加速和自动微分等功能。PyTorch 使用动态计算图,这意味着在运行时可以修改计算图,从而允许更灵活的模型构建和调试。这与 TensorFlow 等框架的静态计算图不同。PyTorch 支持自动微分,可以方便地计算张量的梯度。这为构建和训练深度学习模型提供了便利。PyTorch 提供了构
|
5月前
|
机器学习/深度学习
机器学习粗略框架,帮助你快速入门
机器学习粗略框架,帮助你快速入门
38 0
|
7月前
|
机器学习/深度学习 人工智能 算法
超越核方法的量子机器学习,量子学习模型的统一框架
超越核方法的量子机器学习,量子学习模型的统一框架
|
7月前
|
机器学习/深度学习 Python
【Python】fastapi框架之Web部署机器学习模型
【Python】fastapi框架之Web部署机器学习模型
|
10月前
|
机器学习/深度学习 分布式计算 关系型数据库
直播预告 | pg4ml 机器学习框架系列课程:实现细节、XOR 模型案例(上)
pg4ml 机器学习框架是基于 PostgreSQL v13 实现的、使用 plpgsql 编写的机器学习框架,本次讲解的实验环境基于PolarDB-PG开源数据库。本次分享主要介绍框架的实现细节,并构建XOR两层网络的模型案例,包括数据集、XOR分类的案例与原理、神经网络节点、训练任务结构与执行等内容。
直播预告 |  pg4ml 机器学习框架系列课程:实现细节、XOR 模型案例(上)
|
12月前
|
机器学习/深度学习 负载均衡 网络协议
PANAMA: 共享机器学习集群的网内聚合框架(下)
PANAMA: 共享机器学习集群的网内聚合框架(下)
365 1
PANAMA: 共享机器学习集群的网内聚合框架(下)
|
12月前
|
机器学习/深度学习 缓存 负载均衡
PANAMA: 共享机器学习集群的网内聚合框架(上)
PANAMA: 共享机器学习集群的网内聚合框架(上)
133 1
PANAMA: 共享机器学习集群的网内聚合框架(上)
相关产品
云迁移中心
推荐文章
更多