Github近期最有趣的10款机器学习开源项目

简介: -01- Face Recognition #世界上最简单的人脸识别库 本项目号称世界上最简单的人脸识别库,可使用 Python 和命令行进行调用。该库使用 dlib 顶尖的深度学习人脸识别技术构建,在户外脸部检测数据库基准(Labeled Faces in the Wild benchmark)上的准确率高达 99.38%。

-01-

Face Recognition

#世界上最简单的人脸识别库

本项目号称世界上最简单的人脸识别库,可使用 Python 和命令行进行调用。该库使用 dlib 顶尖的深度学习人脸识别技术构建,在户外脸部检测数据库基准(Labeled Faces in the Wild benchmark)上的准确率高达 99.38%。

项目链接:

https://github.com/ageitgey/face_recognition

-02-

MUSE

#多语言词向量 Python 库

由 Facebook 开源的多语言词向量 Python 库,提供了基于 fastText 实现的多语言词向量和大规模高质量的双语词典,包括无监督和有监督两种。其中有监督方法使用双语词典或相同的字符串,无监督的方法不使用任何并行数据。

无监督方法具体可参考 Word Translation without Parallel Data 这篇论文。

论文链接:

https://www.paperweekly.site/papers/1097

项目链接:

https://github.com/facebookresearch/MUSE

-03-

FoolNLTK

#中文处理工具包

本项目特点:

• 可能不是最快的开源中文分词,但很可能是最准的开源中文分词 

• 基于 BiLSTM 模型训练而成 

• 包含分词,词性标注,实体识别,都有比较高的准确率 

• 用户自定义词典

项目链接:

https://github.com/rockyzhengwu/FoolNLTK

-04-

Arnold

#最擅长玩《毁灭战士》的游戏AI

本项目来自卡耐基梅隆大学,是 2017 年 VizDoom《毁灭战士》AI 死亡竞赛冠军 Arnold 的 PyTorch 开源代码。

论文链接:

https://www.paperweekly.site/papers/1440

项目链接:

https://github.com/glample/Arnold

-05-

Bottom-Up Attention VQA

#2017 VQA Challenge 第一名

本项目是 2017 VQA Challenge 第一名团队两篇论文的 PyTorch 复现。

论文:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

链接:https://www.paperweekly.site/papers/754

论文:Tips and Tricks for Visual Question Answering: Learnings from the 2017 Challenge

链接:https://www.paperweekly.site/papers/1441

项目链接:

https://github.com/hengyuan-hu/bottom-up-attention-vqa


-06-


YOLOv2 - PyTorch

#PyTorch 版 YOLOv2

著名物体检测库 YOLOv2 的 PyTorch 版本,本项目还可以将训练好的 model 转换为适配 Caffe 2。

项目链接:

https://github.com/ruiminshen/yolo2-pytorch

-07-

Simple Railway Captcha Solver

#基于 CNN 的台铁订票验证码辨识

本项目利用简单的 Convolutional Neural Network 来实作辨识台铁订票网站的验证码,训练集的部分以模仿验证码样式的方式来产生、另外验证集的部分则自台铁订票网站撷取,再以手动方式标记约 1000 笔。 

目前验证集对于 6 码型态的验证码的单码辨识率达到 98.84%,整体辨识成功率达到 91.13%。

项目链接:

https://github.com/JasonLiTW/simple-railway-captcha-solver

-08-

AlphaZero-Gomoku

#用 AlphaZero 下五子棋

这是一个将 AlphaZero 算法应用在五子棋的实现,由于五子棋相比围棋或国际象棋简单得多,所以只需几个小时就可以训练出一个不错的 AI 模型。

论文:AlphaZero: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm

链接:https://www.paperweekly.site/papers/1297

论文:AlphaGo Zero: Mastering the game of Go without human knowledge

链接:https://www.paperweekly.site/papers/942

项目链接:

https://github.com/junxiaosong/AlphaZero_Gomoku

-09-

gym-extensions

#OpenAI Gym 扩展集

这是一个 OpenAI Gym 库的扩展包,实现了包括:多任务学习、迁移学习、逆增强学习等功能。

项目链接:

https://github.com/Breakend/gym-extensions

-10-

Myia

#Python 深度学习框架

Myia 是一个全新的 Python 深度学习框架,具有使用简单、自动微分和性能优化的特点。


原文发布时间为:2018-01-02

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关文章
|
6月前
|
人工智能 自然语言处理 iOS开发
『GitHub项目圈选19』推荐5款本周 让人爱不释手 的开源项目
『GitHub项目圈选19』推荐5款本周 让人爱不释手 的开源项目
203 2
|
6月前
|
Java Spring
GitHub 上搜索开源项目技巧
GitHub 上搜索开源项目技巧
82 0
|
3月前
|
JavaScript 前端开发 Java
Github 2024-08-01 开源项目月报 Top17
根据Github Trendings统计,2024年8月共有17个项目上榜。按开发语言分类,项目数量如下:Python项目6个,非开发语言项目与TypeScript项目各4个,JavaScript项目3个,Java、Go及Vue项目各1个。其中,免费编程学习平台freeCodeCamp.org以381,011个Star数领先,提供全栈网页开发和机器学习课程。其他项目涵盖编程书籍、API集合、低代码开发平台等多种资源。
39 1
|
4月前
|
机器学习/深度学习
斯坦福大学博士在GitHub发布的漫画机器学习小抄,竟斩获129k标星
斯坦福大学数据科学博士Chris Albon在GitHub上发布了一份超火的机器学习漫画小抄,发布仅仅一天就斩获GitHub榜首标星暴涨120k,小编有幸获得了一份并把它翻译成中文版本,今天给大家分享出来!
250 14
斯坦福大学博士在GitHub发布的漫画机器学习小抄,竟斩获129k标星
|
3月前
|
人工智能 JavaScript 前端开发
Github 2024-07-01开源项目月报 Top15
根据Github Trendings统计,2024年7月有15个热门项目。按开发语言分类,项目数量如下:Python项目6个,JavaScript项目3个,C++项目2个,PHP、Blade、非开发语言、C#、Lua、Go、MDX、Jupyter Notebook项目各1个。这些项目涵盖技术重建指南、生成式AI教程、模块化GUI、云平台、数据库系统、视频生成模型、AI框架、Shell提示渲染器、Neovim配置、PDF转Markdown工具及语音识别等多种领域和技术。
107 0
|
3月前
|
人工智能 Rust JavaScript
Github 2024-06-01开源项目月报 Top20
根据Github Trendings统计,2024年6月共有20个项目上榜。按开发语言分类,项目数量如下:Python和TypeScript项目各有8项,Jupyter Notebook 3项,HTML、Java、Rust、Vue 和 Batchfile 各1项,C和Svelte也分别有1项。这些项目涵盖多种领域,从AI驱动的应用到游戏开发,反映了开源社区的多样性和创新力。
66 0
|
5月前
|
机器学习/深度学习 人工智能 算法
GitHub星标破千!斯坦福大学的284个机器学习小抄(漫画中文版)
说到人工智能必然要了解机器学习,从信息化软件,到电子商务,然后到高速发展互联网时代,到至今的云计算、大数据等,渗透到我们的生活、工作之中,在互联网的驱动下,人们更清晰的认识和使用数据,不仅仅是数据统计、分析,我们还强调数据挖掘、预测。 机器学习就是对计算机一部分数据进行学习,然后对另外一些数据进行预测与判断。 机器学习的核心是”使用算法解析数据,从中学习,然后对新数据作出决定或预测”。也就是说计算机利用已获取的数据得出某一模型,然后利用此模型进行预测的一种方法,这个过程跟人的学习过程有些类似,比如人获取一定的经验,可以对新问题进行预测。
GitHub星标破千!斯坦福大学的284个机器学习小抄(漫画中文版)
|
4月前
|
机器学习/深度学习
斯坦福大学博士在GitHub发布的漫画机器学习小抄,竟斩获129k标星
斯坦福大学数据科学博士Chris Albon在GitHub上发布了一份超火的机器学习漫画小抄,发布仅仅一天就斩获GitHub榜首标星暴涨120k,小编有幸获得了一份并把它翻译成中文版本,今天给大家分享出来!
|
5月前
|
Shell 测试技术 网络安全
【GIT】如何在GitHub上向一个开源项目贡献代码?
【GIT】如何在GitHub上向一个开源项目贡献代码?
68 5
|
5月前
|
机器学习/深度学习 人工智能 算法
GitHub星标破千!斯坦福大学的284个机器学习小抄(漫画中文版)
说到人工智能必然要了解机器学习,从信息化软件,到电子商务,然后到高速发展互联网时代,到至今的云计算、大数据等,渗透到我们的生活、工作之中,在互联网的驱动下,人们更清晰的认识和使用数据,不仅仅是数据统计、分析,我们还强调数据挖掘、预测。 机器学习就是对计算机一部分数据进行学习,然后对另外一些数据进行预测与判断。 机器学习的核心是”使用算法解析数据,从中学习,然后对新数据作出决定或预测”。也就是说计算机利用已获取的数据得出某一模型,然后利用此模型进行预测的一种方法,这个过程跟人的学习过程有些类似,比如人获取一定的经验,可以对新问题进行预测。

热门文章

最新文章