2018最有用的六个机器学习项目

简介: 用了这六个机器学习开源项目,你的项目一定进行的666!

2018年又是人工智能和机器学习快速发展的一年。许多新的机器学习的项目正在以非常高的影响力影响着诸多领域,特别是医疗保健、金融、语音识别、增强现实和更复杂3D视频渲染。

这一年,我们看到了更多的应用驱动研究,而不是理论研究。虽然这可能有其缺点,但它在短时间内产生了一些巨大的积极影响,产生了可以迅速转化为业务和客户创造价值的新研发,这一趋势在ML开源项目中得到了强烈反映。

让我们来看看过去一年中最实用的6个ML项目。这些项目都公开发布了代码和数据集,允许个别开发人员和小型团队学习并创造价值。它们可能不是理论上最具开创性的作品,但它们很实用!

Fast.ai

Fast.ai库的编写是为了使用现代最佳实践方法以简化且快速准确进行神经网络训练,它抽象了在实践中实施深度神经网络可能带来的所有细节工作。而且它非常易于使用,并且设计它的人有应用程序构建思维。它最初是为Fast.ai课程的学生创建的,该库以简洁易懂的方式编写在易于使用的Pytorch库之上。

cabcd36a0462469685c4eb8ae102d35423a45a68

Detectron

Detectron是Facebook AI用于物体检测和实例分割研究的研究平台,系统是用Caffe2编写。它包含各种对象检测算法的实现,包括:

·Mask R-CNN:使用更快的R-CNN结构的对象检测和实例分割;

·RetinaNet:一个基于(Feature Pyramid Network)算法的网,具有独特的Focal Loss难题

·Faster R-CNN检测最常构;

所有网络都可以使用以下几种可选的分类主干之一:

·ResNeXt {50101152}

·RESNET {50101152}

·Feature Pyramid Network(使用ResNet/ResNeXt);

·VGG16

更重要的是,所有上述这些模型都是带有COCO数据集上的预训练模型,因此你可以立即使用它们!他们已经在Detectron模型动物园中使用标准评估指标进行了测试

a318a69cd1b82b80cc0abf3339c78c5845ee9515

FastText

这是另一个来自Facebook的研究,fastText库专为文本表示和分类而设计。它配备了预先训练的150多种语言的词向量模型,这些单词向量可用于许多任务,包括文本分类,摘要和翻译等。

6f09083a5eb5450955762c71997fcc87c1e13396

Auto-Keras

Auto-Keras是一个用于自动机器学习(AutoML)的开源软件库。它由Texas A&M大学的DATA实验室和社区贡献者开发。AutoML的最终目标是为具有有限数据科学或机器学习背景的开发工程师提供易于访问的深度学习工具。Auto-Keras提供自动搜索深度学习模型的最佳架构和超参数的功能。

5dd834ff3b13ea9ef0e47cdb06b46bc0e3657af2

Dopamine

Dopamine是由Google基于强化学习创建的快速原型设计的研究框架,它旨在灵活且易于使用,实现标准RL算法,指标和基准。

根据Dopamine的文档,他们的设计原则是:

·简单的测试:帮助新用运行基准测试;

·灵活的开新用提供新的新想法;

·可靠一些旧和更流行的算法提供实现;

·可重复性:确保果是可重复;

a7c59efd4462ed79ec9a1dbe1cb1cf8b3a59c007

vid2vid

vid2vid项目是在Pytorch上实现的Nvidia最先进的视频到视频合成的模型。视频到视频合成的目标是学习从输入源视频(例如,一系列语义分割掩模)到精确描绘源视频内容的输出照片拟真视频的映射函数。

这个库的好处在于它的选择:它提供了几种不同的vid2vid应用程序,包括自动驾驶/城市场景,人脸和人体姿势。它还附带了丰富的指令和功能,包括数据集加载、任务评估、训练功能和多GPU!

其他一些有价值的项目:

·ChatterBot用于对话引擎和建聊天机器人的机器学习模型;

·KubeflowKubernetes机器学工具包;

·imgaug用于深度学像增强;

·imbalanced-learnscikit下的python包,专门用于修复不平衡数据集;

·mlflow用于管理ML生命周期的开源平台:包括测试,可重复性和部署;

·AirSim基于虚幻引擎/Unity的自动驾驶器,来自Microsoft AIResearch

本文由阿里云云栖社区组织翻译。

文章原标题《the-6-most-useful-machine-learning-projects-of-the-past-year

作者:George Seif  译者:虎说八道,审校:袁虎。

文章为简译,更为详细的内容,请查看原文

相关文章
|
8月前
|
机器学习/深度学习 人工智能 前端开发
机器学习PAI常见问题之web ui 项目启动后页面打不开如何解决
PAI(平台为智能,Platform for Artificial Intelligence)是阿里云提供的一个全面的人工智能开发平台,旨在为开发者提供机器学习、深度学习等人工智能技术的模型训练、优化和部署服务。以下是PAI平台使用中的一些常见问题及其答案汇总,帮助用户解决在使用过程中遇到的问题。
|
8月前
|
机器学习/深度学习 数据采集 监控
大模型开发:描述一个典型的机器学习项目流程。
机器学习项目涉及问题定义、数据收集、预处理、特征工程、模型选择、训练、评估、优化、部署和监控。每个阶段都是确保模型有效可靠的关键,需要细致操作。
103 0
|
8月前
|
TensorFlow 算法框架/工具 开发工具
使用 TensorFlow 构建机器学习项目:6~10(3)
使用 TensorFlow 构建机器学习项目:6~10(3)
60 0
|
2月前
|
机器学习/深度学习 算法 UED
在数据驱动时代,A/B 测试成为评估机器学习项目不同方案效果的重要方法
在数据驱动时代,A/B 测试成为评估机器学习项目不同方案效果的重要方法。本文介绍 A/B 测试的基本概念、步骤及其在模型评估、算法改进、特征选择和用户体验优化中的应用,同时提供 Python 实现示例,强调其在确保项目性能和用户体验方面的关键作用。
40 6
|
2月前
|
机器学习/深度学习 算法 UED
在数据驱动时代,A/B 测试成为评估机器学习项目效果的重要手段
在数据驱动时代,A/B 测试成为评估机器学习项目效果的重要手段。本文介绍了 A/B 测试的基本概念、步骤及其在模型评估、算法改进、特征选择和用户体验优化中的应用,强调了样本量、随机性和时间因素的重要性,并展示了 Python 在 A/B 测试中的具体应用实例。
31 1
|
2月前
|
机器学习/深度学习 数据采集 Python
从零到一:手把手教你完成机器学习项目,从数据预处理到模型部署全攻略
【10月更文挑战第25天】本文通过一个预测房价的案例,详细介绍了从数据预处理到模型部署的完整机器学习项目流程。涵盖数据清洗、特征选择与工程、模型训练与调优、以及使用Flask进行模型部署的步骤,帮助读者掌握机器学习的最佳实践。
149 1
|
4月前
|
机器学习/深度学习 算法 TensorFlow
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
交通标志识别系统。本系统使用Python作为主要编程语言,在交通标志图像识别功能实现中,基于TensorFlow搭建卷积神经网络算法模型,通过对收集到的58种常见的交通标志图像作为数据集,进行迭代训练最后得到一个识别精度较高的模型文件,然后保存为本地的h5格式文件。再使用Django开发Web网页端操作界面,实现用户上传一张交通标志图片,识别其名称。
158 6
交通标志识别系统Python+卷积神经网络算法+深度学习人工智能+TensorFlow模型训练+计算机课设项目+Django网页界面
|
5月前
|
机器学习/深度学习 人工智能 数据处理
【人工智能】项目实践与案例分析:利用机器学习探测外太空中的系外行星
探测外太空中的系外行星是天文学和天体物理学的重要研究领域。随着望远镜观测技术的进步和大数据的积累,科学家们已经能够观测到大量恒星的光度变化,并尝试从中识别出由行星凌日(行星经过恒星前方时遮挡部分光线)引起的微小亮度变化。然而,由于数据量巨大且信号微弱,传统方法难以高效准确地识别所有行星信号。因此,本项目旨在利用机器学习技术,特别是深度学习,从海量的天文观测数据中自动识别和分类系外行星的信号。这要求设计一套高效的数据处理流程、构建适合的机器学习模型,并实现自动化的预测和验证系统。
91 1
【人工智能】项目实践与案例分析:利用机器学习探测外太空中的系外行星
|
5月前
|
机器学习/深度学习 数据处理 定位技术
构建您的首个机器学习项目:从理论到实践
【8月更文挑战第28天】本文旨在为初学者提供一个简明的指南,通过介绍一个基础的机器学习项目——预测房价——来揭示机器学习的神秘面纱。我们将从数据收集开始,逐步深入到数据处理、模型选择、训练和评估等环节。通过实际操作,你将学会如何利用Python及其强大的科学计算库来实现自己的机器学习模型。无论你是编程新手还是有一定经验的开发者,这篇文章都将为你打开一扇通往机器学习世界的大门。
|
5月前
|
机器学习/深度学习 数据可视化 数据处理
Python vs R:机器学习项目中的实用性与生态系统比较
【8月更文第6天】Python 和 R 是数据科学和机器学习领域中最受欢迎的两种编程语言。两者都有各自的优点和适用场景,选择哪种语言取决于项目的具体需求、团队的技能水平以及个人偏好。本文将从实用性和生态系统两个方面进行比较,并提供代码示例来展示这两种语言在典型机器学习任务中的应用。
161 1