面向 Python 语言的三大顶级机器学习库

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,5000CU*H 3个月
模型训练 PAI-DLC,5000CU*H 3个月
简介:

事实证明,无需掌握艰深的数据科学,我们同样能够在机器学习的世界中徜徉。当然,这段旅程不可避免地需要借助各类大数据、人工智能、深度学习与规模化统计与分析工具的帮助。


c111f8e72a1d7cb79e2d614b79b17025329e8c59

在今天的文章中,我们将共同了解三款最具人气的Python机器学习库,相信能够帮助大家带来更为顺利的数据科学探索体验。

1、Theano


268c1b5f70a1192dfcc770972cc86922cb1f08a8

约十年前诞生的机器学习方案Theano,是目前机器学习领域使用范围最广的CPU与GPU数学编译器之一。

在《Theano:用于快速实现数学表达计算的Python框架》这篇论文当中,作者对这套库进行了全面的概述。“Theano包含多款软件包,用以强化自身功能。能提供高水平用户界面,足以处理多种特定目标,”论文解释称:“其中的Lasagne与Keras能够有效简化深度学习模型以及作为数学表达式的训练算法的架构表达。事实上,概率编程框架PyMC3就在利用Theano以自动生成表达式并快速执行所生成的C代码。(Keras与Lasagne同时运行在TensorFLow与Theano之上。)。”

Theano目前在GitHub上拥有超过2万5千项提交成果以及近300名贡献者,fork次数将接近2千次。

2、TensorFlow

TensorFlow是一套利用数据流图形进行数值计算的开源库。尽管只是开源领域的一名新兵,但这一由谷歌公司牵头的项目已经拥有近1万5千条提交成果以及超过600名GitHub贡献者,模型库的星评更是逼近1万2千颗。


fd92ed7752d3bb0f96b249ca303f79c1ba67f033

在第一份《开源年鉴》当中,TensorFlow被选为2016年最值得fork项目。而在最新的《开源年鉴》内,TensorFlow同样多次亮相。基于TensorFlow的Magenta项目甚至在尝试将机器智能同艺术领域加以联系,探索如何利用它来实现音乐与艺术创作,并由此建立起以艺术家、程序员以及机器学习研究者的混合型社区。另外,Tensorflow支持多种前端语言,但对Python的支持是最好的,Python还被列入2017年热门编程趋势排行。

TensorFlow 1.0于今年2月中旬推出。谷歌在其开发者博客中写道:“尽管刚刚诞生一年,但TensorFlow已经切实帮助研究人员、工程师、艺术家、学生以及其他各类用户完成各类工作,它范畴涵盖语言翻译、皮肤癌早期诊断乃至糖尿病患者并发性失明预防等领域等”。

3、scikit-learn

这套方案立足于NumPy、SciPy以及Matplotlib,并被Spotfiy公司的工程师们用于进行音乐推荐。而在OkCupid公司,是负责对匹配系统进行评估与改进。在Birchbox公司,工作人员正在摸索如何利用scikit-learn支持新产品的开发。


52bc074a7f8e64d417ec94c4e19a66a7c0b9d09e

Scikit-learn目前在GitHub上拥有近2万2千条提交成果与800名贡献者。

本文来自开源中国社区 [http://www.oschina.net]

相关实践学习
机器学习算法(一): 基于逻辑回归的分类预测
基于逻辑回归的分类预测。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
目录
相关文章
|
13天前
|
机器学习/深度学习 数据可视化 搜索推荐
Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。
【7月更文挑战第5天】Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。流程包括数据获取、预处理、探索、模型选择、评估与优化,以及结果可视化。示例展示了用户行为、话题趋势和用户画像分析。Python的丰富生态使得社交媒体洞察变得高效。通过学习和实践,可以提升社交媒体分析能力。
28 1
|
18天前
|
机器学习/深度学习 人工智能 算法
【乐器识别系统】图像识别+人工智能+深度学习+Python+TensorFlow+卷积神经网络+模型训练
乐器识别系统。使用Python为主要编程语言,基于人工智能框架库TensorFlow搭建ResNet50卷积神经网络算法,通过对30种乐器('迪吉里杜管', '铃鼓', '木琴', '手风琴', '阿尔卑斯号角', '风笛', '班卓琴', '邦戈鼓', '卡萨巴', '响板', '单簧管', '古钢琴', '手风琴(六角形)', '鼓', '扬琴', '长笛', '刮瓜', '吉他', '口琴', '竖琴', '沙槌', '陶笛', '钢琴', '萨克斯管', '锡塔尔琴', '钢鼓', '长号', '小号', '大号', '小提琴')的图像数据集进行训练,得到一个训练精度较高的模型,并将其
32 0
【乐器识别系统】图像识别+人工智能+深度学习+Python+TensorFlow+卷积神经网络+模型训练
|
25天前
|
机器学习/深度学习 人工智能 算法
【昆虫识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50
昆虫识别系统,使用Python作为主要开发语言。通过TensorFlow搭建ResNet50卷积神经网络算法(CNN)模型。通过对10种常见的昆虫图片数据集('蜜蜂', '甲虫', '蝴蝶', '蝉', '蜻蜓', '蚱蜢', '蛾', '蝎子', '蜗牛', '蜘蛛')进行训练,得到一个识别精度较高的H5格式模型文件,然后使用Django搭建Web网页端可视化操作界面,实现用户上传一张昆虫图片识别其名称。
176 7
【昆虫识别系统】图像识别Python+卷积神经网络算法+人工智能+深度学习+机器学习+TensorFlow+ResNet50
|
9天前
|
机器学习/深度学习 监控 算法
Python数据分析与机器学习在金融风控中的应用
Python数据分析与机器学习在金融风控中的应用
37 12
|
10天前
|
机器学习/深度学习 数据采集 搜索推荐
Python数据分析与机器学习在电子商务推荐系统中的应用
Python数据分析与机器学习在电子商务推荐系统中的应用
28 5
|
10天前
|
机器学习/深度学习 算法 Python
【Python】已完美解决:机器学习填补数值型缺失值时报错)TypeError: init() got an unexpected keyword argument ‘axis’,
【Python】已完美解决:机器学习填补数值型缺失值时报错)TypeError: init() got an unexpected keyword argument ‘axis’,
13 1
|
13天前
|
机器学习/深度学习 算法 文件存储
使用Python实现深度学习模型:神经架构搜索与自动机器学习
【7月更文挑战第5天】 使用Python实现深度学习模型:神经架构搜索与自动机器学习
29 2
|
23天前
|
机器学习/深度学习 算法 数据挖掘
Python机器学习10大经典算法的讲解和示例
为了展示10个经典的机器学习算法的最简例子,我将为每个算法编写一个小的示例代码。这些算法将包括线性回归、逻辑回归、K-最近邻(KNN)、支持向量机(SVM)、决策树、随机森林、朴素贝叶斯、K-均值聚类、主成分分析(PCA)、和梯度提升(Gradient Boosting)。我将使用常见的机器学习库,如 scikit-learn,numpy 和 pandas 来实现这些算法。
|
29天前
|
机器学习/深度学习 数据采集 算法
【机器学习】Scikit-Learn:Python机器学习的瑞士军刀
【机器学习】Scikit-Learn:Python机器学习的瑞士军刀
46 3
|
29天前
|
机器学习/深度学习 机器人 Python
实践指南,终于有大佬把Python和机器学习讲明白了!
机器学习正在迅速成为数据驱动型世界的一个必备模块。许多不同的领域,如机器人、医学、零售和出版等,都需要依赖这门技术。 机器学习是近年来渐趋热门的一个领域,同时 Python 语言经过一段时间的发展也已逐渐成为主流的编程语言之一。今天给小伙伴们分享的这份手册结合了机器学习和 Python 语言两个热门的领域,通过易于理解的项目详细讲述了如何构建真实的机器学习应用程序。