【译Py】2018年8月,GitHub上的Python数据科学明星项目:自动化机器学习、自然语言处理、可视化、机器学习工作流

简介:

919a715aa33452d54a3fd52d2e03360adc9d37fc

Python数据分析

本文是“五个不容忽视的机器学习项目”一文的续篇。和上篇文章相比,这次选出的项目涉及更多数据科学领域,并且都是GitHub上的开源项目,我们为每个项目都附上了Repo、文档和入门指南的链接,并对每个项目进行了简单介绍。
下面一起来了解一下这些新兴的热门Python库吧,希望本文对你的工作能有所帮助:

1. Auto-Keras自动机器学习库
项目链接:https://github.com/jhfjhfj1/autokeras
文档:http://autokeras.com
入门指南:https://autokeras.com/#example
Auto-Keras是用于自动机器学习(AutoML)的开源软件库。自动机器学习的最终目标是让仅拥有一定数据科学知识或机器学习背景的行业专家可以轻松地应用深度学习模型。Auto-Keras提供了很多用于自动研究深度学习模型架构与超参数的函数。

2. Finetune Scikit-Learn风格的自然语言处理模型微调器
项目链接:https://github.com/IndicoDataSolutions/finetune
文档:https://finetune.indico.io
入门指南:https://finetune.indico.io
Finetune提供了“通过生成式预训练改进对语言的理解”的预训练语言模型,并扩充了OpenAI/finetune-language-model库。

3. GluonNLP - 让自然语言处理变得更简单
项目链接:https://github.com/dmlc/gluon-nlp
文档:http://gluon-nlp.mxnet.io
入门指南: https://github.com/dmlc/gluon-nlp#quick-start-guide
GluonNLP可以使文本处理、数据加载及构建神经模型变得更容易,加快自然语言处理研究的速度。

4. animatplot - 基于Matplotlib的Python动图库
项目链接:https://github.com/t-makaro/animatplot
文档:https://animatplot.readthedocs.io/en/latest
入门指南:https://animatplot.readthedocs.io/en/latest/tutorial/getting_started.html
请注意,本库文档里的例子比较简单,本文引用的是该库在GitHub上列出的功能更全、形式更酷的示例图。

3149e9bc38177f1fe387e7ca124fbe2c1ed69efc

animatplot

5. MLflow - 机器学习生命周期的开源平台
项目链接:https://github.com/mlflow/mlflow
文档:https://mlflow.org/docs/latest/index.html
入门指南:https://mlflow.org/docs/latest/quickstart.html
MLflow是用来管理机器学习整体生命周期的开源平台,这个平台提供了以下主要三个功能:

● MLflow Tracking :跟踪实验,以用来记录和比较机器学习的参数。
● MLflow Projects :以可复用、可再现的形式,将机器学习的代码进行打包,以便分享给其他数据科学家或传递给生产环境。
● MLflow Models :管理各类机器学习库中的模型,并部署到不同的模型服务及应用平台。
MLflow通过访问REST API和CLI实现其功能,所以它不依赖于某个库,并且支持多种机器学习库与编程语言,为了使用方便,它还内置了Python API。


原文发布时间为:2018-09-3

本文作者:Matthew Mayo

本文来自云栖社区合作伙伴“Python爱好者社区”,了解相关信息可以关注“Python爱好者社区”。

相关文章
|
4月前
|
数据可视化 搜索推荐 大数据
基于python大数据的北京旅游可视化及分析系统
本文深入探讨智慧旅游系统的背景、意义及研究现状,分析其在旅游业中的作用与发展潜力,介绍平台架构、技术创新、数据挖掘与服务优化等核心内容,并展示系统实现界面。
|
4月前
|
异构计算 Python
ERROR: pip’s dependency resolver does not currently take into 报错-Python项目依赖冲突的解决方案-优雅草优雅草卓伊凡
ERROR: pip’s dependency resolver does not currently take into 报错-Python项目依赖冲突的解决方案-优雅草优雅草卓伊凡
439 1
|
4月前
|
API 语音技术 开发者
Python 项目打包,并上传到 PyPI,分享项目
本文介绍了如何使用 Poetry 打包并发布一个 Python 项目至 PyPI。内容包括:项目创建、配置 `pyproject.toml` 文件、构建软件包、上传至 PyPI、安装与使用。通过实例 iGTTS 展示了从开发到发布的完整流程,帮助开发者快速分享自己的 Python 工具。
|
4月前
|
数据可视化 数据挖掘 大数据
基于python大数据的水文数据分析可视化系统
本研究针对水文数据分析中的整合难、分析单一和可视化不足等问题,提出构建基于Python的水文数据分析可视化系统。通过整合多源数据,结合大数据、云计算与人工智能技术,实现水文数据的高效处理、深度挖掘与直观展示,为水资源管理、防洪减灾和生态保护提供科学决策支持,具有重要的应用价值和社会意义。
|
4月前
|
人工智能 Shell Python
ERROR: pip’s dependency resolver does not currently take into 报错-Python项目依赖冲突的解决方案-优雅草优雅草卓伊凡
ERROR: pip’s dependency resolver does not currently take into 报错-Python项目依赖冲突的解决方案-优雅草优雅草卓伊凡
273 0
GitHub 上的超级 Python 游戏项目,不容错过!
今天分享一个超级牛的 GitHub 项目,是一个专门的基于 Pygame 开发小游戏的项目。该项目就开源在 G 站上,目前已经获得了 2.6K 的 Star 和 1.5K 的 Fork,可以说是超级牛掰了!
GitHub 上的超级 Python 游戏项目,不容错过!
|
数据采集 编解码 算法
Github | 推荐一个Python脚本集合项目
Github | 推荐一个Python脚本集合项目
407 5
|
算法 程序员 开发工具
GitHub上新!14个Python项目详细教程(附完整代码)
Python作为程序员的宠儿,越来越得到人们的关注,使用Python进行应用程序开发的也越来越多。 今天给小伙伴们分享的这份项目教程完整代码已上传至GitHub,你可以选择跟着这份教程一段一段的手敲出来这几个项目,也可以直接从GitHub上copy下来。

热门文章

最新文章

推荐镜像

更多