2018年又是人工智能和机器学习快速发展的一年。许多新的机器学习的项目正在以非常高的影响力影响着诸多领域,特别是医疗保健、金融、语音识别、增强现实和更复杂3D视频渲染。
这一年,我们看到了更多的应用驱动研究,而不是理论研究。虽然这可能有其缺点,但它在短时间内产生了一些巨大的积极影响,产生了可以迅速转化为业务和客户创造价值的新研发,这一趋势在ML开源项目中得到了强烈反映。
让我们来看看过去一年中最实用的6个ML项目。这些项目都公开发布了代码和数据集,允许个别开发人员和小型团队学习并创造价值。它们可能不是理论上最具开创性的作品,但它们很实用!
Fast.ai库的编写是为了使用现代最佳实践方法以简化且快速准确进行神经网络训练,它抽象了在实践中实施深度神经网络可能带来的所有细节工作。而且它非常易于使用,并且设计它的人有应用程序构建思维。它最初是为Fast.ai课程的学生创建的,该库以简洁易懂的方式编写在易于使用的Pytorch库之上。
Detectron是Facebook AI用于物体检测和实例分割研究的研究平台,系统是用Caffe2编写。它包含各种对象检测算法的实现,包括:
·Mask R-CNN:使用更快的R-CNN结构的对象检测和实例分割;
·RetinaNet:一个基于(Feature Pyramid Network)算法的网络,具有独特的Focal Loss来处理难题;
·Faster R-CNN:对象检测网络最常见的结构;
所有网络都可以使用以下几种可选的分类主干之一:
·Feature Pyramid Network(使用ResNet/ResNeXt);
·VGG16;
更重要的是,所有上述这些模型都是带有COCO数据集上的预训练模型,因此你可以立即使用它们!他们已经在Detectron模型动物园中使用标准评估指标进行了测试。
FastText
这是另一个来自Facebook的研究,fastText库专为文本表示和分类而设计。它配备了预先训练的150多种语言的词向量模型,这些单词向量可用于许多任务,包括文本分类,摘要和翻译等。
Auto-Keras
Auto-Keras是一个用于自动机器学习(AutoML)的开源软件库。它由Texas A&M大学的DATA实验室和社区贡献者开发。AutoML的最终目标是为具有有限数据科学或机器学习背景的开发工程师提供易于访问的深度学习工具。Auto-Keras提供自动搜索深度学习模型的最佳架构和超参数的功能。
Dopamine
Dopamine是由Google基于强化学习创建的快速原型设计的研究框架,它旨在灵活且易于使用,实现标准RL算法,指标和基准。
根据Dopamine的文档,他们的设计原则是:
·简单的测试:帮助新用户运行基准测试;
·灵活的开发:为新用户提供新的创新想法;
·可靠:为一些较旧和更流行的算法提供实现;
·可重复性:确保结果是可重复;
vid2vid
vid2vid项目是在Pytorch上实现的Nvidia最先进的视频到视频合成的模型。视频到视频合成的目标是学习从输入源视频(例如,一系列语义分割掩模)到精确描绘源视频内容的输出照片拟真视频的映射函数。
这个库的好处在于它的选择:它提供了几种不同的vid2vid应用程序,包括自动驾驶/城市场景,人脸和人体姿势。它还附带了丰富的指令和功能,包括数据集加载、任务评估、训练功能和多GPU!
其他一些有价值的项目:
·ChatterBot:用于对话引擎和创建聊天机器人的机器学习模型;
·Kubeflow:Kubernetes的机器学习工具包;
·imgaug:用于深度学习的图像增强;
·imbalanced-learn:scikit下的python包,专门用于修复不平衡数据集;
·mlflow:用于管理ML生命周期的开源平台:包括测试,可重复性和部署;
·AirSim:基于虚幻引擎/Unity的自动驾驶汽车模拟器,来自Microsoft AI和Research;
本文由阿里云云栖社区组织翻译。
文章原标题《the-6-most-useful-machine-learning-projects-of-the-past-year》
作者:George Seif 译者:虎说八道,审校:袁虎。
文章为简译,更为详细的内容,请查看原文。