『GitHub项目圈选06』推荐5款本周 超火 的开源AI项目

简介: 『GitHub项目圈选06』推荐5款本周 超火 的开源AI项目

1、AnimateAnyone


AnimateAnyone 项目是由阿里巴巴智能计算研究院开发,你只需提供一个静态的角色图像(包括真人、动漫/卡通角色等)和一些动作、姿势(比如跳舞、走路),便可将其动画化,同时保留角色的细节特征(如面部表情、服装细节等)。


Star:9.8k


项目地址:https://github.com/HumanAIGC/AnimateAnyone


2、MagicAnimate


MagicAnimate 项目与阿里的AnimateAnyone是同类型同技术项目,由新加坡国立大学和字节跳动联合推出,同样是利用扩散模型(diffusion models)创造时间连贯的人像动画,将静态图像变成动态视频。


字节团队表示,在挑战性极高的TikTok舞蹈数据集上,Magic Animate生成的视频的真实度比最强基线提高了超过38%。


Star:6.6K


项目地址:https://github.com/magic-research/magic-animate


体验地址:https://huggingface.co/spaces/zcxu-eric/magicanimate


3、Insanely Fast Whisper


insanely-fast-whisper 是一款功能强大的音频转录工具,支持自动转录和说话人分割功能。


主要功能特性:

  • 支持说话人分割和区分,识别不同说话人,有助于分析和整理多人音频
  • 自动转录,可快速将长音频文件转录为文本,无需手动逐字逐句
  • 能在98秒内转录2.5小时的音频


Star:3.9k


项目地址:http://github.com/Vaibhavs10/insanely-fast-whisper


4、GPTs-work


GPTs-work 是由微信团队前腾讯高级工程师(博主:艾逗比)开发,使用 nextjs 技术搭建而成。可以直接使用该GPTs导航项目,也可以替换成任意站点,做一个自己的通用导航站点。


Star:946


体验地址:https://gpts.works/


项目地址:https://github.com/all-in-aigc/gpts-works


5、MLX


MLX 是 Apple 芯片上用于机器学习的阵列框架,由 Apple 机器学习研究团队为您提供。


MLX 的一些主要功能包括:


★ 熟悉的 API:MLX 有一个紧随 NumPy 的 Python API。MLX 还拥有功能齐全的 C++ API,它与 Python API 非常相似。MLX 拥有更高级的软件包,例如mlx.nn和mlx.optimizersAPI,它们紧密遵循 PyTorch,以简化构建更复杂的模型。

★ 可组合函数转换:MLX 具有用于自动微分、自动矢量化和计算图优化的可组合函数转换。

★ 惰性计算:MLX 中的计算是惰性计算。数组仅在需要时才会具体化。

★ 动态图构建:MLX 中的计算图是动态构建的。更改函数参数的形状不会触发缓慢的编译,并且调试简单直观。

★ 多设备:操作可以在任何支持的设备上运行(当前为 CPU 和 GPU)。

★ 统一内存:与 MLX 和其他框架的显着区别是统一内存模型。MLX 中的数组位于共享内存中。可以在任何支持的设备类型上执行 MLX 阵列上的操作,而无需移动数据。


MLX 的设计灵感来自 NumPy、 PyTorch、Jax和 ArrayFire等框架。


Star:7.4k


项目地址:https://github.com/ml-explore/mlx

以上就是本周 GitHub圈选 的5款开源项目,有兴趣的同学可以前往了解探索!!

相关文章
|
15天前
|
数据可视化 Rust 机器学习/深度学习
mlop.ai 无脑使用教程 (机器学习工具 WandB/ClearML 的首个国区开源平替)
mlop.ai 是首个为国区用户优化的机器学习工具,全栈免费开源,是主流付费解决方案 ClearML/WandB 的开源平替。常规实验追踪的工具经常大幅人为降速,mlop因为底层为Rust代码,能轻松支持高频数据写入。如需更多开发者帮助或企业支持,敬请联系cn@mlop.ai
66 12
mlop.ai 无脑使用教程 (机器学习工具 WandB/ClearML 的首个国区开源平替)
|
21天前
|
Web App开发 人工智能 自然语言处理
Open Avatar Chat:阿里开源实时数字人对话系统,让AI对话实现2.2秒低延迟交互
Open Avatar Chat是阿里开源的模块化数字人对话系统,支持文本/音频/视频多模态交互,采用可替换组件设计,平均响应延迟仅2.2秒,为开发者提供灵活高效的解决方案。
449 3
Open Avatar Chat:阿里开源实时数字人对话系统,让AI对话实现2.2秒低延迟交互
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
Qwen3强势来袭:推理力爆表、语言超百种、智能体协作领先,引领AI开源大模型
Qwen3强势来袭:推理力爆表、语言超百种、智能体协作领先,引领AI开源大模型
Qwen3强势来袭:推理力爆表、语言超百种、智能体协作领先,引领AI开源大模型
|
19天前
|
存储 人工智能 测试技术
DeepWiki:告别迷茫!AI轻松解析Github代码库
DeepWiki 的核心目标是帮助开发者快速理解复杂的代码仓库。无论是公共仓库还是私有项目,它都可以通过简单的操作生成类似 Wikipedia 的文档页面。
|
16天前
|
人工智能 自然语言处理 搜索推荐
13.5K Star!支持5国语言+全栈语音生成,这个开源AI语音项目绝了!
CosyVoice是由FunAudioLLM团队开发的多语言大语音生成模型,支持中文、英语、日语、韩语和粤语等5种语言。该项目提供从推理、训练到部署的全栈能力,具备零样本语音克隆、跨语言合成、指令控制等前沿功能。其技术架构包括底层模型、多语言支持、框架支持及部方案等,性能优越,RTF<0.2,GPU内存<4GB,QPS>20。相比同类项目,CosyVoice在语言支持、特色功能和部署难度上表现出色,支持本地部署保障数据隐私,并大幅降低商业方案成本。适用于自媒体创作、在线教育、游戏开发、智能硬件和影视制作等多种场景。
|
18天前
|
开发工具 C++ git
五分钟看懂推送本地项目到 GitHub新手菜鸡
五分钟看懂推送本地项目到 GitHub新手菜鸡
|
人工智能 自然语言处理 JavaScript
重磅!GitHub 推出 AI 自动写代码神器,再也不用到处找代码了…
大家好,我是你们的码农大哥——栈长。 3 年前,自 微软收购 Github 后大动作不断啊,两年多之前就让 Github 私库免费了!,后面还推出了 Github for Mobile 移动版,这些我都已经在公众号Java技术栈作过分享,没看过的可以回过头看下。 最近,Github 又搞大事了,推出了一款 AI 编程神器——Github Copilot,牛逼啊,下面栈长带大家来看看到底是什么鬼?
1074 0
重磅!GitHub 推出 AI 自动写代码神器,再也不用到处找代码了…
|
3月前
|
开发工具 git C++
【够用就好002】外行第一次发布github项目仓库
#deepseek#自学 记录外行学习代码的历程 今天是上传自己的工具代码到github仓库,一直以来是伸手党克隆别人的项目,今天在deepseek的辅导下上传自己的内容。
|
4月前
|
开发工具 git
如何操作github,gitee,gitcode三个git平台建立镜像仓库机制,这样便于维护项目只需要维护一个平台仓库地址的即可-优雅草央千澈
如何操作github,gitee,gitcode三个git平台建立镜像仓库机制,这样便于维护项目只需要维护一个平台仓库地址的即可-优雅草央千澈
292 69
如何操作github,gitee,gitcode三个git平台建立镜像仓库机制,这样便于维护项目只需要维护一个平台仓库地址的即可-优雅草央千澈
|
2月前
|
开发工具 git
vscode推送项目到github仓库故障解决1
本文介绍了如何优雅解决本地仓库与远程仓库历史记录不一致的问题,并提供避免未来问题的最佳实践。核心在于理解问题根源(如历史记录差异和常见原因),采用推荐的解决方案(先本地初始化再关联远程仓库),并遵循一致的工作流程、团队协作规范及熟悉 Git 命令。通过强制推送或合并无关历史记录等方式处理现有冲突,同时养成良好习惯以预防类似问题。

热门文章

最新文章