开发者社区> 呆鸟776> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

【译Py】2018年8月,GitHub上的Python数据科学明星项目:自动化机器学习、自然语言处理、可视化、机器学习工作流

简介: 原文作者:Matthew Mayo 原文地址:GitHub Python Data Science Spotlight: AutoML, NLP, Visualization, ML Workflows Python数据分析 本文是“五个不容忽视的机器学习项目”一文的续篇。
+关注继续查看

原文作者:Matthew Mayo
原文地址:GitHub Python Data Science Spotlight: AutoML, NLP, Visualization, ML Workflows

img_c335e712aa5f2496a92adfb666192919.jpe
Python数据分析

本文是“五个不容忽视的机器学习项目”一文的续篇。和上篇文章相比,这次选出的项目涉及更多数据科学领域,并且都是GitHub上的开源项目,我们为每个项目都附上了Repo、文档和入门指南的链接,并对每个项目进行了简单介绍。
下面一起来了解一下这些新兴的热门Python库吧,希望本文对你的工作能有所帮助:

  1. Auto-Keras自动机器学习库
    项目链接:https://github.com/jhfjhfj1/autokeras
    文档:http://autokeras.com
    入门指南:https://autokeras.com/#example
    Auto-Keras是用于自动机器学习(AutoML)的开源软件库。自动机器学习的最终目标是让仅拥有一定数据科学知识或机器学习背景的行业专家可以轻松地应用深度学习模型。Auto-Keras提供了很多用于自动研究深度学习模型架构与超参数的函数。
  2. Finetune Scikit-Learn风格的自然语言处理模型微调器
    项目链接:https://github.com/IndicoDataSolutions/finetune
    文档:https://finetune.indico.io
    入门指南:https://finetune.indico.io
    Finetune提供了“通过生成式预训练改进对语言的理解”的预训练语言模型,并扩充了OpenAI/finetune-language-model库。
  3. GluonNLP - 让自然语言处理变得更简单
    项目链接:https://github.com/dmlc/gluon-nlp
    文档:http://gluon-nlp.mxnet.io
    入门指南: https://github.com/dmlc/gluon-nlp#quick-start-guide
    GluonNLP可以使文本处理、数据加载及构建神经模型变得更容易,加快自然语言处理研究的速度。
  4. animatplot - 基于Matplotlib的Python动图库
    项目链接:https://github.com/t-makaro/animatplot
    文档:https://animatplot.readthedocs.io/en/latest
    入门指南: https://animatplot.readthedocs.io/en/latest/tutorial/getting_started.html
    请注意,本库文档里的例子比较简单,本文引用的是该库在GitHub上列出的功能更全、形式更酷的示例图。
    img_37ebbad1a368b88b3cfcaf9afa3bcc5a.gif
    animatplot
  5. MLflow - 机器学习生命周期的开源平台
    项目链接:https://github.com/mlflow/mlflow
    文档:https://mlflow.org/docs/latest/index.html
    入门指南:https://mlflow.org/docs/latest/quickstart.html
    MLflow是用来管理机器学习整体生命周期的开源平台,这个平台提供了以下主要三个功能:
  • MLflow Tracking:跟踪实验,以用来记录和比较机器学习的参数。
  • MLflow Projects:以可复用、可再现的形式,将机器学习的代码进行打包,以便分享给其他数据科学家或传递给生产环境。
  • MLflow Models:管理各类机器学习库中的模型,并部署到不同的模型服务及应用平台。
    MLflow通过访问REST API和CLI实现其功能,所以它不依赖于某个库,并且支持多种机器学习库与编程语言,为了使用方便,它还内置了Python API。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
财经数据科学实战训练营python可视化 习题8
财经数据科学实战训练营python可视化 习题8
0 0
财经数据科学实战训练营python数据处理(二)习题7
财经数据科学实战训练营python数据处理(二)习题7
0 0
财经数据科学实战训练营python数据处理(一)习题6
财经数据科学实战训练营python数据处理(一)习题6
0 0
财经数据科学实战训练营python数据获取:习题5
财经数据科学实战训练营python数据获取:习题5
0 0
财经数据科学实战训练营python基础入门(四)测试习题
财经数据科学实战训练营python基础入门(四)测试习题
0 0
财经数据科学实战训练营python基础入门(三)测试习题
财经数据科学实战训练营python基础入门(三)测试习题
0 0
财经数据科学实战训练营python基础入门(二)测试习题
财经数据科学实战训练营python基础入门(二)测试习题
0 0
财经数据科学实战训练营python基础入门(一)测试习题
财经数据科学实战训练营python基础入门(一)测试习题
0 0
数据科学中常见的6个概率分布(Python实现)
数据科学中常见的6个概率分布(Python实现
0 0
整理了3个用于数据科学的Python库,稍微简单的讲解下
改变不了环境,但可以改变自己;你改变不了事实,但可以改变态度;你改变不了过去,但可以改变现在。
0 0
+关注
呆鸟776
坚持学习Python和English,努力让译文读起来像中文
文章
问答
文章排行榜
最热
最新
相关电子书
更多
给运维工程师的Python实战课
立即下载
Python 脚本速查手册
立即下载
ACE 区域技术发展峰会:Flink Python Table API入门及实践
立即下载