Github 2024-07-01开源项目月报 Top15-阿里云开发者社区

根据Github Trendings的统计，本月(2024-07-01统计)共有15个项目上榜。根据开发语言中项目的数量，汇总情况如下：

开发语言	项目数量
Python项目	6
JavaScript项目	3
C++项目	2
PHP项目	1
Blade项目	1
非开发语言项目	1
C#项目	1
Lua项目	1
Go项目	1
MDX项目	1
Jupyter Notebook项目	1

从零开始构建你喜爱的技术

创建周期：2156 天
Star数量：253338 个
Fork数量：24043 次
关注人数：253338 人
贡献人数：116 人
Open Issues数量：319 个
Github地址：https://github.com/codecrafters-io/build-your-own-x.git
项目首页: https://codecrafters.io

这个存储库是一本精心编写的、逐步指南的汇编，可以从零开始重新创建各种技术，如3D渲染器、区块链/加密货币、游戏、操作系统、Web浏览器等。它旨在帮助用户通过理解和构建自己喜欢的技术来掌握编程。

初学者的生成式人工智能（第2版）

创建周期：259 天
开发语言：Jupyter Notebook
协议类型：MIT License
Star数量：25764 个
Fork数量：16105 次
关注人数：25764 人
贡献人数：50 人
Open Issues数量：17 个
Github地址：https://github.com/microsoft/generative-ai-for-beginners.git
项目首页: https://microsoft.github.io/generative-ai-for-beginners/

《初学者的生成式人工智能（第2版）》是由微软云倡导者提供的一门全面的18课程，教授一切开始构建生成式人工智能应用所需的知识。

ComfyUI：强大而模块化的稳定扩散GUI

创建周期：399 天
开发语言：Python, JavaScript
协议类型：GNU General Public License v3.0
Star数量：25663 个
Fork数量：2741 次
关注人数：25663 人
贡献人数：90 人
Open Issues数量：1263 个
Github地址：https://github.com/comfyanonymous/ComfyUI.git

ComfyUI是一个开源项目，提供强大而模块化的稳定扩散图形用户界面（GUI）、API和后端，具有图/节点界面。它允许用户使用基于图/节点/流程图的界面设计和执行高级稳定扩散管道。

Coolify: 开源自助云平台

创建周期：1112 天
开发语言：PHP, Blade
协议类型：Apache License 2.0
Star数量：10527 个
Fork数量：567 次
关注人数：10527 人
贡献人数：80 人
Open Issues数量：59 个
Github地址：https://github.com/coollabsio/coolify.git
项目首页: https://coolify.io

Coolify是一个开源且可自行托管的替代品，可替代Heroku、Netlify和Vercel等云平台。它可以帮助用户通过SSH连接在自己的硬件上管理服务器、应用程序和数据库，包括VPS、裸金属和树莓派。该平台旨在在使用个人服务器时提供云的便利性，确保没有供应商锁定，并使用户即使停止使用Coolify也能保留对其资源的控制。

DuckDB - 高性能分析数据库系统

创建周期：2173 天
开发语言：C++
协议类型：MIT License
Star数量：18540 个
Fork数量：1549 次
关注人数：18540 人
贡献人数：321 人
Open Issues数量：348 个
Github地址：https://github.com/duckdb/duckdb.git
项目首页: http://www.duckdb.org

DuckDB是一个高性能的分析数据库系统，旨在快速、可靠、便携且易于使用。它提供了丰富的SQL语言方言，支持诸如相关子查询、窗口函数、排序规则和复杂类型等高级功能。DuckDB可作为独立的CLI应用程序使用，并且具有针对Python、R、Java、Wasm等的客户端，与pandas和dplyr等包深度集成。

Open-Sora: 构建自己的视频生成模型

创建周期：17 天
开发语言：Python
协议类型：Apache License 2.0
Star数量：1151 个
Fork数量：96 次
关注人数：1151 人
贡献人数：6 人
Open Issues数量：10 个
Github地址：https://github.com/hpcaitech/Open-Sora.git

Open-Sora是一个开源项目，允许用户构建类似于OpenAI的Sora的自己的视频生成模型。它提供了创建自定义视频生成模型所需的工具和资源。

Fabric: 用人工智能增强人类能力的开源框架

创建周期：40 天
开发语言：Python, JavaScript
协议类型：MIT License
Star数量：5128 个
Fork数量：406 次
关注人数：5128 人
贡献人数：22 人
Open Issues数量：2 个
Github地址：https://github.com/danielmiessler/fabric.git

Fabric 是一个开源框架，旨在利用人工智能增强人类能力。它提供了将问题分解为组件的哲学，并提供了一种提示的框架方法。该框架包括快速入门指南、设置 fabric 客户端、使用模式、创建 fabric mill、结构、组件、CLI-native 特性、直接调用模式、示例以及主要贡献者的详细信息。

GitKraken制作的高度可定制的Shell提示渲染器

创建周期：1916 天
开发语言：Go, MDX
协议类型：MIT License
Star数量：14894 个
Fork数量：2250 次
关注人数：14894 人
贡献人数：346 人
Open Issues数量：20 个
Github地址：https://github.com/JanDeDobbeleer/oh-my-posh.git
项目首页: https://ohmyposh.dev

这个项目是一个开源的、高度可定制的、低延迟的跨平台/Shell提示渲染器。它是使用GitKraken制作的，充满了爱。

LazyVim: Neovim配置的懒人方式

创建周期：506 天
开发语言：Lua
协议类型：Apache License 2.0
Star数量：13257 个
Fork数量：894 次
关注人数：13257 人
贡献人数：152 人
Open Issues数量：83 个
Github地址：https://github.com/LazyVim/LazyVim.git
项目首页: https://lazyvim.github.io/

LazyVim是由lazy.nvim提供支持的Neovim设置，旨在使用户轻松定制和扩展其配置。它提供了根据需要调整配置的灵活性，同时也提供了预配置设置的便利性。

Marker: 快速准确的PDF转Markdown工具

创建周期：218 天
开发语言：Python
协议类型：GNU General Public License v3.0
Star数量：10397 个
Fork数量：502 次
关注人数：10397 人
贡献人数：4 人
Open Issues数量：48 个
Github地址：https://github.com/VikParuchuri/marker.git

Marker是一个开源工具，可以快速准确地将PDF转换为markdown。它支持各种类型的文档、所有语言，并且可以移除页眉、页脚和其他文档附加信息。此外，它还可以格式化表格和代码块，提取并保存图片，将大多数方程式转换为LaTeX格式。Marker可以在GPU、CPU或MPS上运行。

Transformers.js：网络上的最先进机器学习

创建周期：482 天
开发语言：JavaScript
协议类型：Apache License 2.0
Star数量：8264 个
Fork数量：458 次
关注人数：8264 人
贡献人数：28 人
Open Issues数量：200 个
Github地址：https://github.com/xenova/transformers.js.git
项目首页: https://huggingface.co/docs/transformers.js

Transformers.js 是一个开源项目，可以在网络上实现最先进的机器学习。它允许在浏览器中直接运行 🤗 Transformers，无需服务器。该库在功能上等同于 Hugging Face 的 transformers python 库，并支持自然语言处理、计算机视觉、音频和多模态领域的各种任务。它使用 ONNX Runtime 在浏览器中运行模型，并提供了使用 🤗 Optimum 将预训练的 PyTorch、TensorFlow 或 JAX 模型轻松转换为 ONNX 的功能。

MiniCPM-V 和 OmniLMM: 图文理解的开源多模态大模型系列

创建周期：78 天
开发语言：Python
协议类型：Apache License 2.0
Star数量：861 个
Fork数量：49 次
关注人数：861 人
贡献人数：8 人
Open Issues数量：10 个
Github地址：https://github.com/OpenBMB/MiniCPM-V.git

MiniCPM-V 和 OmniLMM 是面向图文理解的开源多模态大模型系列。它们接受图像和文本输入，并提供高质量的文本输出。MiniCPM-V 2.0 版本能够处理任意长宽比的图像，具有 180 万像素，实现了类似 Gemini Pro 的场景文字识别能力和与 GPT-4V 相当的低幻觉率。OmniLMM-12B 模型在多个基准测试中优于同规模的其他模型，并实现了比 GPT-4V 更低的幻觉率。

视频翻译配音工具

创建周期：252 天
开发语言：Python
协议类型：GNU General Public License v3.0
Star数量：6555 个
Fork数量：751 次
关注人数：6555 人
贡献人数：5 人
Open Issues数量：20 个
Github地址：https://github.com/jianchang512/pyvideotrans.git
项目首页: https://pyvideotrans.com

这是一个视频翻译配音工具，可以将一种语言的视频翻译为指定语言的视频，自动生成和添加该语言的字幕和配音。它支持多种语音识别和文字翻译模型，允许保留背景伴奏音乐，并且支持多种语言。主要用途包括翻译视频并配音、音频或视频转为字幕、批量字幕创建配音、批量字幕翻译、音频、视频、字幕合并、从视频中分离出音频以及下载YouTube视频。它提供了预打包版本和源码部署的详细说明。

StableSwarmUI: 模块化稳定扩散Web用户界面

创建周期：402 天
开发语言：C#, JavaScript
协议类型：MIT License
Star数量：3341 个
Fork数量：289 次
关注人数：3341 人
贡献人数：17 人
Open Issues数量：33 个
Github地址：https://github.com/Stability-AI/StableSwarmUI.git

StableSwarmUI是一个模块化的Web用户界面，旨在使强大的工具易于访问，注重高性能和可扩展性。目前处于测试版状态，并计划进行进一步的开发和改进。该用户界面适用于初学者和高级用户，提供主要的生成选项卡界面和舒适的工作流选项卡等功能。该项目欢迎贡献和建议，以增强其功能和功能。

使用Kaldi和onnxruntime的语音识别、文本转语音和说话人识别功能

创建周期：669 天
开发语言：C++
协议类型：Apache License 2.0
Star数量：2230 个
Fork数量：270 次
关注人数：2230 人
贡献人数：68 人
Open Issues数量：137 个
Github地址：https://github.com/k2-fsa/sherpa-onnx.git
项目首页: https://k2-fsa.github.io/sherpa/onnx/index.html

这个开源项目利用下一代Kaldi和onnxruntime提供了语音识别、文本转语音和说话人识别功能，无需互联网连接。它支持嵌入式系统、Android、iOS、树莓派、RISC-V、x86_64服务器，并与多种编程语言兼容，包括C/C++、Python、Kotlin、C#、Go、NodeJS、Java、Swift、Dart、JavaScript和Flutter。该项目包括语音识别、语音合成、说话人验证、说话人识别、口语语言识别、音频标记、语音活动检测和关键词识别等功能。

Github 2024-07-01开源项目月报 Top15