1、AnimateAnyone
AnimateAnyone
项目是由阿里巴巴智能计算研究院开发,你只需提供一个静态的角色图像(包括真人、动漫/卡通角色等)和一些动作、姿势(比如跳舞、走路),便可将其动画化,同时保留角色的细节特征(如面部表情、服装细节等)。
Star:9.8k
项目地址:https://github.com/HumanAIGC/AnimateAnyone
2、MagicAnimate
MagicAnimate
项目与阿里的AnimateAnyone
是同类型同技术项目,由新加坡国立大学和字节跳动联合推出,同样是利用扩散模型(diffusion models)创造时间连贯的人像动画,将静态图像变成动态视频。
字节团队表示,在挑战性极高的TikTok舞蹈数据集上,Magic Animate生成的视频的真实度比最强基线提高了超过38%。
Star:6.6K
项目地址:https://github.com/magic-research/magic-animate
体验地址:https://huggingface.co/spaces/zcxu-eric/magicanimate
3、Insanely Fast Whisper
insanely-fast-whisper
是一款功能强大的音频转录工具,支持自动转录和说话人分割功能。
主要功能特性:
- 支持说话人分割和区分,识别不同说话人,有助于分析和整理多人音频
- 自动转录,可快速将长音频文件转录为文本,无需手动逐字逐句
- 能在98秒内转录2.5小时的音频
Star:3.9k
项目地址:http://github.com/Vaibhavs10/insanely-fast-whisper
4、GPTs-work
GPTs-work
是由微信团队前腾讯高级工程师(博主:艾逗比)开发,使用 nextjs 技术搭建而成。可以直接使用该GPTs导航项目,也可以替换成任意站点,做一个自己的通用导航站点。
Star:946
体验地址:https://gpts.works/
项目地址:https://github.com/all-in-aigc/gpts-works
5、MLX
MLX
是 Apple 芯片上用于机器学习的阵列框架,由 Apple 机器学习研究团队为您提供。
MLX 的一些主要功能包括:
★ 熟悉的 API:MLX 有一个紧随 NumPy 的 Python API。MLX 还拥有功能齐全的 C++ API,它与 Python API 非常相似。MLX 拥有更高级的软件包,例如mlx.nn和mlx.optimizersAPI,它们紧密遵循 PyTorch,以简化构建更复杂的模型。
★ 可组合函数转换:MLX 具有用于自动微分、自动矢量化和计算图优化的可组合函数转换。
★ 惰性计算:MLX 中的计算是惰性计算。数组仅在需要时才会具体化。
★ 动态图构建:MLX 中的计算图是动态构建的。更改函数参数的形状不会触发缓慢的编译,并且调试简单直观。
★ 多设备:操作可以在任何支持的设备上运行(当前为 CPU 和 GPU)。
★ 统一内存:与 MLX 和其他框架的显着区别是统一内存模型。MLX 中的数组位于共享内存中。可以在任何支持的设备类型上执行 MLX 阵列上的操作,而无需移动数据。
MLX 的设计灵感来自 NumPy、 PyTorch、Jax和 ArrayFire等框架。
Star:7.4k
项目地址:https://github.com/ml-explore/mlx
以上就是本周 GitHub圈选 的5款开源项目,有兴趣的同学可以前往了解探索!!