『GitHub项目圈选06』推荐5款本周 超火 的开源AI项目

简介: 『GitHub项目圈选06』推荐5款本周 超火 的开源AI项目

1、AnimateAnyone


AnimateAnyone 项目是由阿里巴巴智能计算研究院开发,你只需提供一个静态的角色图像(包括真人、动漫/卡通角色等)和一些动作、姿势(比如跳舞、走路),便可将其动画化,同时保留角色的细节特征(如面部表情、服装细节等)。


Star:9.8k


项目地址:https://github.com/HumanAIGC/AnimateAnyone


2、MagicAnimate


MagicAnimate 项目与阿里的AnimateAnyone是同类型同技术项目,由新加坡国立大学和字节跳动联合推出,同样是利用扩散模型(diffusion models)创造时间连贯的人像动画,将静态图像变成动态视频。


字节团队表示,在挑战性极高的TikTok舞蹈数据集上,Magic Animate生成的视频的真实度比最强基线提高了超过38%。


Star:6.6K


项目地址:https://github.com/magic-research/magic-animate


体验地址:https://huggingface.co/spaces/zcxu-eric/magicanimate


3、Insanely Fast Whisper


insanely-fast-whisper 是一款功能强大的音频转录工具,支持自动转录和说话人分割功能。


主要功能特性:

  • 支持说话人分割和区分,识别不同说话人,有助于分析和整理多人音频
  • 自动转录,可快速将长音频文件转录为文本,无需手动逐字逐句
  • 能在98秒内转录2.5小时的音频


Star:3.9k


项目地址:http://github.com/Vaibhavs10/insanely-fast-whisper


4、GPTs-work


GPTs-work 是由微信团队前腾讯高级工程师(博主:艾逗比)开发,使用 nextjs 技术搭建而成。可以直接使用该GPTs导航项目,也可以替换成任意站点,做一个自己的通用导航站点。


Star:946


体验地址:https://gpts.works/


项目地址:https://github.com/all-in-aigc/gpts-works


5、MLX


MLX 是 Apple 芯片上用于机器学习的阵列框架,由 Apple 机器学习研究团队为您提供。


MLX 的一些主要功能包括:


★ 熟悉的 API:MLX 有一个紧随 NumPy 的 Python API。MLX 还拥有功能齐全的 C++ API,它与 Python API 非常相似。MLX 拥有更高级的软件包,例如mlx.nn和mlx.optimizersAPI,它们紧密遵循 PyTorch,以简化构建更复杂的模型。

★ 可组合函数转换:MLX 具有用于自动微分、自动矢量化和计算图优化的可组合函数转换。

★ 惰性计算:MLX 中的计算是惰性计算。数组仅在需要时才会具体化。

★ 动态图构建:MLX 中的计算图是动态构建的。更改函数参数的形状不会触发缓慢的编译,并且调试简单直观。

★ 多设备:操作可以在任何支持的设备上运行(当前为 CPU 和 GPU)。

★ 统一内存:与 MLX 和其他框架的显着区别是统一内存模型。MLX 中的数组位于共享内存中。可以在任何支持的设备类型上执行 MLX 阵列上的操作,而无需移动数据。


MLX 的设计灵感来自 NumPy、 PyTorch、Jax和 ArrayFire等框架。


Star:7.4k


项目地址:https://github.com/ml-explore/mlx

以上就是本周 GitHub圈选 的5款开源项目,有兴趣的同学可以前往了解探索!!

目录
打赏
0
0
0
0
31
分享
相关文章
Manus再遭复刻!开源多智能体协作工具,实时查看每个AI员工的"脑回路"
LangManus 是一个基于分层多智能体系统的 AI 自动化框架,支持多种语言模型和工具集成,能够高效完成复杂任务,适用于人力资源、房产决策、旅行规划等多个场景。
314 0
RuoYi AI:1人搞定AI中台!开源全栈式AI开发平台,快速集成大模型+RAG+支付等模块
RuoYi AI 是一个全栈式 AI 开发平台,支持本地 RAG 方案,集成多种大语言模型和多媒体功能,适合企业和个人开发者快速搭建个性化 AI 应用。
116 21
RuoYi AI:1人搞定AI中台!开源全栈式AI开发平台,快速集成大模型+RAG+支付等模块
Multi-Agent Orchestrator:亚马逊开源AI智能体自动协作黑科技!重构人机交互逻辑,1秒精准分配任务
Multi-Agent Orchestrator 是亚马逊开源的多智能体框架,能够动态分配代理、维护上下文、支持多种代理类型,适用于客户服务、智能交通、物流配送等复杂场景。
50 9
Multi-Agent Orchestrator:亚马逊开源AI智能体自动协作黑科技!重构人机交互逻辑,1秒精准分配任务
Dify-Plus:企业级AI管理核弹!开源方案吊打SaaS,额度+密钥+鉴权系统全面集成
Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,新增用户额度、密钥管理、Web 登录鉴权等功能,优化权限管理,适合企业场景使用。
137 3
Dify-Plus:企业级AI管理核弹!开源方案吊打SaaS,额度+密钥+鉴权系统全面集成
Agent TARS:一键让AI托管电脑!字节开源PC端多模态AI助手,无缝集成浏览器与系统操作
Agent TARS 是一款开源的多模态AI助手,能够通过视觉解析网页并无缝集成命令行和文件系统,帮助用户高效完成复杂任务。
2010 3
Agent TARS:一键让AI托管电脑!字节开源PC端多模态AI助手,无缝集成浏览器与系统操作
1.4K star!几分钟搞定AI视频创作,这个开源神器让故事可视化如此简单!
story-flicks 是一个基于AI技术的自动化视频生成工具,能够将文字剧本快速转化为高质量短视频。开发者@alecm20通过深度学习算法,实现了从文本解析到视频合成的全流程自动化处理,支持多平台适配输出,是内容创作者和自媒体运营者的效率神器。
ReasonGraph:别让AI成黑箱!这个开源工具把大模型的脑回路画给你看
ReasonGraph是一款开源的可视化分析工具,能将大语言模型的复杂推理过程转化为直观图表,支持50+主流模型和多种推理方法,帮助开发者快速理解AI思考逻辑并优化模型表现。
39 0
【够用就好002】外行第一次发布github项目仓库
#deepseek#自学 记录外行学习代码的历程 今天是上传自己的工具代码到github仓库,一直以来是伸手党克隆别人的项目,今天在deepseek的辅导下上传自己的内容。

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等