『GitHub项目圈选06』推荐5款本周 超火 的开源AI项目

简介: 『GitHub项目圈选06』推荐5款本周 超火 的开源AI项目

1、AnimateAnyone


AnimateAnyone 项目是由阿里巴巴智能计算研究院开发,你只需提供一个静态的角色图像(包括真人、动漫/卡通角色等)和一些动作、姿势(比如跳舞、走路),便可将其动画化,同时保留角色的细节特征(如面部表情、服装细节等)。


Star:9.8k


项目地址:https://github.com/HumanAIGC/AnimateAnyone


2、MagicAnimate


MagicAnimate 项目与阿里的AnimateAnyone是同类型同技术项目,由新加坡国立大学和字节跳动联合推出,同样是利用扩散模型(diffusion models)创造时间连贯的人像动画,将静态图像变成动态视频。


字节团队表示,在挑战性极高的TikTok舞蹈数据集上,Magic Animate生成的视频的真实度比最强基线提高了超过38%。


Star:6.6K


项目地址:https://github.com/magic-research/magic-animate


体验地址:https://huggingface.co/spaces/zcxu-eric/magicanimate


3、Insanely Fast Whisper


insanely-fast-whisper 是一款功能强大的音频转录工具,支持自动转录和说话人分割功能。


主要功能特性:

  • 支持说话人分割和区分,识别不同说话人,有助于分析和整理多人音频
  • 自动转录,可快速将长音频文件转录为文本,无需手动逐字逐句
  • 能在98秒内转录2.5小时的音频


Star:3.9k


项目地址:http://github.com/Vaibhavs10/insanely-fast-whisper


4、GPTs-work


GPTs-work 是由微信团队前腾讯高级工程师(博主:艾逗比)开发,使用 nextjs 技术搭建而成。可以直接使用该GPTs导航项目,也可以替换成任意站点,做一个自己的通用导航站点。


Star:946


体验地址:https://gpts.works/


项目地址:https://github.com/all-in-aigc/gpts-works


5、MLX


MLX 是 Apple 芯片上用于机器学习的阵列框架,由 Apple 机器学习研究团队为您提供。


MLX 的一些主要功能包括:


★ 熟悉的 API:MLX 有一个紧随 NumPy 的 Python API。MLX 还拥有功能齐全的 C++ API,它与 Python API 非常相似。MLX 拥有更高级的软件包,例如mlx.nn和mlx.optimizersAPI,它们紧密遵循 PyTorch,以简化构建更复杂的模型。

★ 可组合函数转换:MLX 具有用于自动微分、自动矢量化和计算图优化的可组合函数转换。

★ 惰性计算:MLX 中的计算是惰性计算。数组仅在需要时才会具体化。

★ 动态图构建:MLX 中的计算图是动态构建的。更改函数参数的形状不会触发缓慢的编译,并且调试简单直观。

★ 多设备:操作可以在任何支持的设备上运行(当前为 CPU 和 GPU)。

★ 统一内存:与 MLX 和其他框架的显着区别是统一内存模型。MLX 中的数组位于共享内存中。可以在任何支持的设备类型上执行 MLX 阵列上的操作,而无需移动数据。


MLX 的设计灵感来自 NumPy、 PyTorch、Jax和 ArrayFire等框架。


Star:7.4k


项目地址:https://github.com/ml-explore/mlx

以上就是本周 GitHub圈选 的5款开源项目,有兴趣的同学可以前往了解探索!!

相关文章
|
10天前
|
存储 人工智能 前端开发
Qoder + ADB Supabase :5分钟GET超火AI手办生图APP
本文介绍如何利用Qoder、阿里云ADB Supabase和通义千问图像编辑模型,快速搭建AI手办生图Flutter应用。无需传统后端,实现从前端生成到数据存储、AI服务集成的全链路敏捷开发,展现Vibe Coding的高效实践。
Qoder + ADB Supabase :5分钟GET超火AI手办生图APP
|
9天前
|
人工智能 中间件 数据库
沐曦 GPU 融入龙蜥,共筑开源 AI 基础设施新底座
沐曦自加入社区以来,一直与龙蜥社区在推动 AIDC OS 的开源社区建设等方面保持合作。
|
4天前
|
人工智能 文字识别 自然语言处理
引爆硅谷!DeepSeek开源谷歌“核心机密”?2025秋季开源视觉AI模型重磅盘点
DeepSeek-OCR震撼开源,以3B小模型高效压缩视觉文本,低成本处理长文档,被誉为“AI的JPEG时刻”。本文盘点五大热门视觉大模型:DeepSeek-OCR、Qwen3-VL、GLM-4.5V、SAIL-VL2、DINOv3,涵盖OCR、多模态理解、视觉特征提取等方向,从优缺点、适用场景到微调建议全面解读,助力开发者把握“预训练+微调”黄金窗口,快速落地视觉应用。
256 100
|
6天前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
550 17
|
6天前
|
人工智能 自然语言处理 Shell
我们开源了一款 AI 驱动的用户社区
KoalaQA 是一款开源的 AI 驱动用户社区,支持智能问答、语义搜索、自动运营与辅助创作,助力企业降低客服成本,提升响应效率与用户体验。一键部署,灵活接入大模型,快速构建专属售后服务社区。
我们开源了一款 AI 驱动的用户社区
|
28天前
|
Apache 数据安全/隐私保护 Docker
【开源问答系统】GitHub 14.9k star 的开源问答引擎来了,三分钟搭建完成~~~
Apache Answer 是一款开源问答系统,助力团队将零散知识沉淀为结构化资产。支持 Docker 快速部署、插件扩展、权限控制与多语言,兼具高效搜索、投票排序与私有化部署能力,适用于技术社区、企业知识库与用户支持场景。
318 22
|
16天前
|
人工智能 搜索推荐 UED
一个牛逼的国产AI自动化工具,开源了 !
AiPy是国产开源AI工具,结合大语言模型与Python,支持本地部署。用户只需用自然语言描述需求,即可自动生成并执行代码,轻松实现数据分析、清洗、可视化等任务,零基础也能玩转编程,被誉为程序员的智能助手。
|
26天前
|
缓存 自然语言处理 JavaScript
抓紧上车,别再错过啦, Github 开源后台管理平台,Naive UI !!!
naive-ui-pro 是基于 Vue3 + Vite + TypeScript 的免费开源中后台模板,主打“路由插件化架构”,将权限、页签、缓存等功能拆解为可插拔模块,像搭积木一样灵活组装。内置 14+ 插件、Pro Naive UI 组件库与丰富示例,支持移动端适配、多主题、国际化,MIT 许可,开箱即用,助力高效开发。
156 4
|
1月前
|
人工智能 JavaScript 前端开发
Github 2024-11-04 开源项目周报 Top14
本周GitHub热门项目涵盖屏幕截图转代码、网页监控、低代码开发等。Python与TypeScript主导,亮点项目包括AI生成代码工具、开源社交应用Bluesky及机器人框架LeRobot,展现AI与自动化技术的快速发展趋势。
156 15

热门文章

最新文章