Github 2024-07-01开源项目月报 Top15

本文涉及的产品
视觉智能开放平台,分割抠图1万点
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: 根据Github Trendings统计,2024年7月有15个热门项目。按开发语言分类,项目数量如下:Python项目6个,JavaScript项目3个,C++项目2个,PHP、Blade、非开发语言、C#、Lua、Go、MDX、Jupyter Notebook项目各1个。这些项目涵盖技术重建指南、生成式AI教程、模块化GUI、云平台、数据库系统、视频生成模型、AI框架、Shell提示渲染器、Neovim配置、PDF转Markdown工具及语音识别等多种领域和技术。

根据Github Trendings的统计,本月(2024-07-01统计)共有15个项目上榜。根据开发语言中项目的数量,汇总情况如下:

开发语言 项目数量
Python项目 6
JavaScript项目 3
C++项目 2
PHP项目 1
Blade项目 1
非开发语言项目 1
C#项目 1
Lua项目 1
Go项目 1
MDX项目 1
Jupyter Notebook项目 1

从零开始构建你喜爱的技术

这个存储库是一本精心编写的、逐步指南的汇编,可以从零开始重新创建各种技术,如3D渲染器、区块链/加密货币、游戏、操作系统、Web浏览器等。它旨在帮助用户通过理解和构建自己喜欢的技术来掌握编程。

初学者的生成式人工智能(第2版)

《初学者的生成式人工智能(第2版)》是由微软云倡导者提供的一门全面的18课程,教授一切开始构建生成式人工智能应用所需的知识。

ComfyUI:强大而模块化的稳定扩散GUI

  • 创建周期:399 天
  • 开发语言:Python, JavaScript
  • 协议类型:GNU General Public License v3.0
  • Star数量:25663 个
  • Fork数量:2741 次
  • 关注人数:25663 人
  • 贡献人数:90 人
  • Open Issues数量:1263 个
  • Github地址:https://github.com/comfyanonymous/ComfyUI.git

ComfyUI是一个开源项目,提供强大而模块化的稳定扩散图形用户界面(GUI)、API和后端,具有图/节点界面。它允许用户使用基于图/节点/流程图的界面设计和执行高级稳定扩散管道。

Coolify: 开源自助云平台

Coolify是一个开源且可自行托管的替代品,可替代Heroku、Netlify和Vercel等云平台。它可以帮助用户通过SSH连接在自己的硬件上管理服务器、应用程序和数据库,包括VPS、裸金属和树莓派。该平台旨在在使用个人服务器时提供云的便利性,确保没有供应商锁定,并使用户即使停止使用Coolify也能保留对其资源的控制。

DuckDB - 高性能分析数据库系统

DuckDB是一个高性能的分析数据库系统,旨在快速、可靠、便携且易于使用。它提供了丰富的SQL语言方言,支持诸如相关子查询、窗口函数、排序规则和复杂类型等高级功能。DuckDB可作为独立的CLI应用程序使用,并且具有针对Python、R、Java、Wasm等的客户端,与pandas和dplyr等包深度集成。

Open-Sora: 构建自己的视频生成模型

  • 创建周期:17 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:1151 个
  • Fork数量:96 次
  • 关注人数:1151 人
  • 贡献人数:6 人
  • Open Issues数量:10 个
  • Github地址:https://github.com/hpcaitech/Open-Sora.git

Open-Sora是一个开源项目,允许用户构建类似于OpenAI的Sora的自己的视频生成模型。它提供了创建自定义视频生成模型所需的工具和资源。

Fabric: 用人工智能增强人类能力的开源框架

  • 创建周期:40 天
  • 开发语言:Python, JavaScript
  • 协议类型:MIT License
  • Star数量:5128 个
  • Fork数量:406 次
  • 关注人数:5128 人
  • 贡献人数:22 人
  • Open Issues数量:2 个
  • Github地址:https://github.com/danielmiessler/fabric.git

Fabric 是一个开源框架,旨在利用人工智能增强人类能力。它提供了将问题分解为组件的哲学,并提供了一种提示的框架方法。该框架包括快速入门指南、设置 fabric 客户端、使用模式、创建 fabric mill、结构、组件、CLI-native 特性、直接调用模式、示例以及主要贡献者的详细信息。

GitKraken制作的高度可定制的Shell提示渲染器

这个项目是一个开源的、高度可定制的、低延迟的跨平台/Shell提示渲染器。它是使用GitKraken制作的,充满了爱。

LazyVim: Neovim配置的懒人方式

LazyVim是由lazy.nvim提供支持的Neovim设置,旨在使用户轻松定制和扩展其配置。它提供了根据需要调整配置的灵活性,同时也提供了预配置设置的便利性。

Marker: 快速准确的PDF转Markdown工具

  • 创建周期:218 天
  • 开发语言:Python
  • 协议类型:GNU General Public License v3.0
  • Star数量:10397 个
  • Fork数量:502 次
  • 关注人数:10397 人
  • 贡献人数:4 人
  • Open Issues数量:48 个
  • Github地址:https://github.com/VikParuchuri/marker.git

Marker是一个开源工具,可以快速准确地将PDF转换为markdown。它支持各种类型的文档、所有语言,并且可以移除页眉、页脚和其他文档附加信息。此外,它还可以格式化表格和代码块,提取并保存图片,将大多数方程式转换为LaTeX格式。Marker可以在GPU、CPU或MPS上运行。

Transformers.js:网络上的最先进机器学习

Transformers.js 是一个开源项目,可以在网络上实现最先进的机器学习。它允许在浏览器中直接运行 🤗 Transformers,无需服务器。该库在功能上等同于 Hugging Face 的 transformers python 库,并支持自然语言处理、计算机视觉、音频和多模态领域的各种任务。它使用 ONNX Runtime 在浏览器中运行模型,并提供了使用 🤗 Optimum 将预训练的 PyTorch、TensorFlow 或 JAX 模型轻松转换为 ONNX 的功能。

MiniCPM-V 和 OmniLMM: 图文理解的开源多模态大模型系列

  • 创建周期:78 天
  • 开发语言:Python
  • 协议类型:Apache License 2.0
  • Star数量:861 个
  • Fork数量:49 次
  • 关注人数:861 人
  • 贡献人数:8 人
  • Open Issues数量:10 个
  • Github地址:https://github.com/OpenBMB/MiniCPM-V.git

MiniCPM-V 和 OmniLMM 是面向图文理解的开源多模态大模型系列。它们接受图像和文本输入,并提供高质量的文本输出。MiniCPM-V 2.0 版本能够处理任意长宽比的图像,具有 180 万像素,实现了类似 Gemini Pro 的场景文字识别能力和与 GPT-4V 相当的低幻觉率。OmniLMM-12B 模型在多个基准测试中优于同规模的其他模型,并实现了比 GPT-4V 更低的幻觉率。

视频翻译配音工具


这是一个视频翻译配音工具,可以将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。它支持多种语音识别和文字翻译模型,允许保留背景伴奏音乐,并且支持多种语言。主要用途包括翻译视频并配音、音频或视频转为字幕、批量字幕创建配音、批量字幕翻译、音频、视频、字幕合并、从视频中分离出音频以及下载YouTube视频。它提供了预打包版本和源码部署的详细说明。

StableSwarmUI: 模块化稳定扩散Web用户界面

  • 创建周期:402 天
  • 开发语言:C#, JavaScript
  • 协议类型:MIT License
  • Star数量:3341 个
  • Fork数量:289 次
  • 关注人数:3341 人
  • 贡献人数:17 人
  • Open Issues数量:33 个
  • Github地址:https://github.com/Stability-AI/StableSwarmUI.git

StableSwarmUI是一个模块化的Web用户界面,旨在使强大的工具易于访问,注重高性能和可扩展性。目前处于测试版状态,并计划进行进一步的开发和改进。该用户界面适用于初学者和高级用户,提供主要的生成选项卡界面和舒适的工作流选项卡等功能。该项目欢迎贡献和建议,以增强其功能和功能。

使用Kaldi和onnxruntime的语音识别、文本转语音和说话人识别功能

这个开源项目利用下一代Kaldi和onnxruntime提供了语音识别、文本转语音和说话人识别功能,无需互联网连接。它支持嵌入式系统、Android、iOS、树莓派、RISC-V、x86_64服务器,并与多种编程语言兼容,包括C/C++、Python、Kotlin、C#、Go、NodeJS、Java、Swift、Dart、JavaScript和Flutter。该项目包括语音识别、语音合成、说话人验证、说话人识别、口语语言识别、音频标记、语音活动检测和关键词识别等功能。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
4月前
|
Rust 前端开发 JavaScript
Github 2024-05-20 开源项目周报 Top15
根据Github Trendings的统计,2024年5月20日当周共有15个项目上榜。按开发语言分类,项目数量如下:Python项目5个,TypeScript项目3个,C++项目2个,Jupyter Notebook项目2个,C、Go、Rust和C#项目各1个。介绍了多个值得关注的项目,包括ChatGPT桌面应用程序、Fooocus图像生成软件、Jellyfin媒体系统等。这些项目涵盖了多种功能和技术领域,值得关注和研究。
76 3
|
4月前
|
SQL JavaScript 前端开发
Github 2024-08-05 开源项目周报 Top15
根据 Github Trendings 的统计,本周(2024年8月5日统计)共有15个项目上榜。以下是根据开发语言汇总的项目数量: - Go 项目:4个 - JavaScript 项目:3个 - Python 项目:3个 - Java 项目:2个 - TypeScript 项目:2个 - C 项目:1个 - Shell 项目:1个 - Dockerfile 项目:1个 - 非开发语言项目:1个
151 2
|
4月前
|
人工智能 Rust JavaScript
Github 2024-08-26 开源项目周报Top15
根据Github Trendings的统计,本周共有15个项目上榜。以下是按开发语言汇总的项目数量:Python项目8个,TypeScript、C++ 和 Rust 项目各2个,Jupyter Notebook、Shell、Swift 和 Dart 项目各1个。其中,RustDesk 是一款用 Rust 编写的开源远程桌面软件,可作为 TeamViewer 的替代品;Whisper 是一个通用的语音识别模型,基于大规模音频数据集训练而成;初学者的生成式人工智能(第2版)则是由微软提供的18门课程,教授构建生成式AI应用所需的知识。
147 1
|
4月前
|
Rust Dart 前端开发
Github 2024-08-19 开源项目周报Top15
根据Github Trendings的统计,本周(2024年8月19日统计)共有15个项目上榜。按开发语言分类,上榜项目数量如下:Python项目最多,有7项;其次是JavaScript和TypeScript,各有3项;Dart有2项;HTML、PowerShell、Clojure和C++各1项。此外,还介绍了多个热门项目,包括Bootstrap 5、RustDesk、ComfyUI、易采集、Penpot等,涵盖了Web开发、远程桌面、自动化测试、设计工具等多个领域。
123 1
|
4月前
|
JavaScript 前端开发 Java
Github 2024-08-01 开源项目月报 Top17
根据Github Trendings统计,2024年8月共有17个项目上榜。按开发语言分类,项目数量如下:Python项目6个,非开发语言项目与TypeScript项目各4个,JavaScript项目3个,Java、Go及Vue项目各1个。其中,免费编程学习平台freeCodeCamp.org以381,011个Star数领先,提供全栈网页开发和机器学习课程。其他项目涵盖编程书籍、API集合、低代码开发平台等多种资源。
50 1
|
4月前
|
存储 JavaScript 前端开发
Github 2024-07-29 开源项目周报Top15
根据 Github Trendings 的统计,本周(2024年7月29日统计)共有15个项目上榜。按开发语言分类,项目数量如下:Python、Java、HTML 和 C 项目各有2项;TypeScript、JavaScript、Vue 和 Go 各有1项;另有1项非特定语言项目、1项 Dart 项目、1项 C++ 项目、1项 Rust 项目及1项 Jupyter Notebook 项目。这些项目涵盖了多种领域,如API开发、照片管理、PDF处理、AI技术等。
73 1
|
4月前
|
Rust JavaScript 前端开发
Github 2024-07-15 开源项目周报 Top15
根据 Github Trendings 的统计,2024年7月15日当周共有15个项目上榜。以下是按开发语言分类的项目数量汇总:Python项目5个,非开发语言项目4个,JavaScript项目3个,TypeScript项目2个,Go、Solidity和Java项目各1个,Rust项目1个。此外,介绍了多个值得关注的项目,包括免费编程学习平台 freeCodeCamp.org、免费编程书籍和学习资源清单、免费 API 集合等,涵盖了不同编程语言和技术领域。
61 1
|
4月前
|
人工智能 JavaScript API
Github 2024-07-08 开源项目周报 Top15
根据Github Trendings的统计,本周(2024年7月8日统计)共有15个项目上榜。按开发语言分类,Python项目最多,有6项;其次是C++和TypeScript,各有3项;Jupyter Notebook和JavaScript各2项;QML、非开发语言项目、Rust则各有1项。这些项目涵盖了多种领域,包括编程教育、API集合、语言模型、十六进制编辑器等。
61 1
|
4月前
|
人工智能 JavaScript Shell
Github 2024-06-10开源项目周报 Top15
根据Github Trendings的统计,本周(2024年6月10日统计)共有15个项目上榜。按开发语言分类,上榜项目数量如下:Python 8项,Jupyter Notebook 和 Go 各2项,C++、Shell、Lua 和 JavaScript 各1项。亮点项目包括Python-100天从新手到大师、Syncthing开源同步工具、初学者的生成式人工智能(第2版)等。这些项目涵盖了代码教育、文件同步、数据分析等多个领域。
74 1
|
4月前
|
Rust JavaScript 前端开发
Github 2024-05-27 开源项目周报Top15
根据Github Trendings的统计,本周(2024年5月27日统计)共有15个项目上榜。按开发语言分类,项目数量如下:TypeScript项目6个,Rust、Python和JavaScript项目各3个,Java、C#、C++、C、Lua项目各1个。这些项目涵盖多种领域,包括算法实现、生产力工具、设计模式、代码生成、无代码爬虫及编程学习资源等。
63 1