『GitHub项目圈选12』推荐5款本周 深受追捧 的AI开源项目

简介: 『GitHub项目圈选12』推荐5款本周 深受追捧 的AI开源项目

1、GPT-SoVits


GPT-SoVits 是一款强大的支持少量语音转换、文本到语音的音色克隆模型。支持中文、英文、日文的语音推理。


该项目是RVC-BossRcell (AI音色转换技术Sovits开发者)共同研究,历时半年开发出来的一款全新的低成本的易用的音色克隆工具。


据开发者及各大博主测验,仅需提供 5 秒语音样本即可体验达到 80%~95% 像的声音克隆。若提供 1 分钟语音样本可以逼近真人的效果,且训练出高质量的 TTS 模型!


Star:2.7k


项目地址:https://github.com/RVC-Boss/GPT-SoVITS


特征:

  • 零样本 TTS:输入 5 秒语音样本并体验即时文本到语音转换。
  • Few-shot TTS:仅用 1 分钟的训练数据即可微调模型,以提高语音相似度和真实感。
  • 跨语言支持:用与训练数据集不同的语言进行推理,目前支持英语、日语和中文。
  • WebUI工具:集成工具包括语音伴奏分离、自动训练集分割、中文ASR和文本标注,帮助初学者创建训练数据集和GPT/SoVITS模型。


小编本周也编写过该工具详细介绍及使用的文章,如想更深入了解,可以点击下面链接阅读文章:

GPT-SoVits:刚上线两天就获得了1.4k star的开源声音克隆项目!效果炸裂的跨语言音色克隆模型!


2、Umi-OCR


Umi-OCR 是一款基于百度自研的 PaddleOCR框架 开源的 OCR 项目源、免费的离线OCR软件


Star:17.2k


项目地址:https://github.com/hiroi-sora/Umi-OCR


狂揽16.9k star!Umi-OCR文字识别太火了,解决了多少人的痛点!

该工具开源至今,一直再对功能进行更新支持,截屏/粘贴/批量导入图片、段落排版/去除水印、扫描/生成二维码等功能都已支持,不可畏不强大!


最重要的是免费、离线!


功能特点:


  •  免费:所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 高效:自带高效率离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。
  • 灵活:支持命令行、HTTP接口等多种调用方式。
  • 功能:截图OCR / 批量OCR / 二维码 / 数学公式识别


该工具很有很多优化的功能,还有体验上的优化,比如:兼容windows7系统、支持多国语言切换、字体/背景更换、系统托盘/快捷键等等诸多优化。


3、AI Gateway


AI Gateway 是一个AI领域的开源工具,是应用程序和托管 LLM 之间的接口,通过统一简单的 API,让用户轻松快速接入 100 多种大语言模型,如 OpenAI、Anthropic、Mistral、LLama2、Google Gemini 等。

Star:2.9k


项目地址:https://github.com/Portkey-AI/gateway


这款 AI 网关项目简直太棒了,轻松接入OpenAI、LLama2、Google Gem)ini等 100 多种大语言模型!


特色功能:


  • ✅ 速度极快(快 9.9 倍),占用空间极小(已安装约 45kb)
  • ✅ 跨多个模型、提供程序和密钥的负载平衡
  • ✅ 回退确保您的应用程序保持弹性
  • ✅ 默认情况下具有指数回退的 自动重试
  • ✅ 插件中间件根据需要
  • ✅ 经过超过100B 代币的战斗测试


特征:


  • 统一API签名
  • 倒退
  • 自动重试
  • 负载均衡


AI Gateway 适用于各种人工智能应用场景,包括自然语言处理、文本生成、语音识别等。无论是个人开发者还是企业级应用,都可以受益于该工具的便捷性和稳定性。


4、DDColor


DDColor 是一个由 阿里达摩院 研究的基于深度学习技术的 图像上色模型,它能够自动将黑白或灰度图像着色,使图像更加生动逼真。


该模型采用了先进的神经网络架构和训练技术,能够识别图像中的物体和场景,并为其添加逼真的颜色。


Star:402


项目地址:https://github.com/piddnad/DDColor


DDColor:AI图像着色工具,优秀的黑白图像上色模型,支持双解码器!


DDColor 模型 采用双解码器技术,DDColor能够同时考虑色彩分布和像素级详细信息,能实现高度真实的图像上色效果。


其高质量的着色效果和快速的处理速度使其在多个领域都具有广泛的应用前景,为图像处理领域带来了新的可能性。


5、PhotoMaker


PhotoMaker 是腾讯Arc实验室同南开大学合作研发的一款通过 堆叠 ID技术嵌入 定制出逼真的人体照片的开源工具。


Star:5.6k


项目地址:https://github.com/TencentARC/PhotoMaker


被鹅厂最新开源AI绘画工具PhotoMaker圈粉了,多风格头像生成器就靠它了!


一个可以创建任何风格的任何人的照片/绘画/头像的生成器。


能根据描述生成符合描述的人物照片。也能把几个不同人的照片特征混合在一起,创造出一个全新的人物形象。


还能改变照片人物的性别、年龄和生成多种风格的其他照片。快速逼真,效果自然。更加无需训练LoRA即可保持角色一致性。


以上就是本周 GitHub圈选 的5款开源项目,有兴趣的同学可以前往了解探索哈!!

相关文章
|
6天前
|
人工智能 安全 网络安全
揭秘!大模型私有化部署的全方位安全攻略与优化秘籍,让你的AI项目稳如磐石,数据安全无忧!
【10月更文挑战第24天】本文探讨了大模型私有化部署的安全性考量与优化策略,涵盖数据安全、防火墙配置、性能优化、容器化部署、模型更新和数据备份等方面,提供了实用的示例代码,旨在为企业提供全面的技术参考。
32 6
|
24天前
|
机器学习/深度学习 人工智能 自然语言处理
探索未来AI趋势:掌握Function Calling技巧,解锁大模型精度提升的秘密武器,让你的数据科学项目事半功倍!
【10月更文挑战第6天】随着深度学习技术的发展,神经网络模型日益复杂,Function Calling作为一种机制,在提升大模型准确度方面发挥重要作用。本文探讨Function Calling的概念及其在大模型中的应用,通过具体示例展示如何利用其优化模型性能。Function Calling使模型能在运行过程中调用特定函数,提供额外的信息处理或计算服务,增强模型表达能力和泛化能力。例如,在文本生成模型中,根据上下文调用词性标注或实体识别等功能模块,可使生成的文本更自然准确。通过合理设计条件判断逻辑和功能模块权重,Function Calling能显著提升模型整体表现。
28 3
|
3天前
|
人工智能 Anolis 开发者
|
28天前
|
人工智能 自动驾驶 机器人
【通义】AI视界|苹果自动驾驶汽车项目画上句号:加州测试许可被取消
本文精选了24小时内的重要科技新闻,包括Waymo前CEO批评马斯克对自动驾驶的态度、AMD发布新款AI芯片但股价波动、苹果造车项目终止、Familia.AI推出家庭应用以及AI逆向绘画技术的进展。更多内容请访问通义官网体验。
|
15天前
|
人工智能 IDE API
在我的开源项目(AI Godot 桌宠)中使用通义灵码
作为一名AI代码助手的忠实用户,我近期尝试了阿里开源的Qwen模型。通过在个人项目——一个由Godot引擎开发的AI桌宠软件中测试Qwen,我发现其在处理小众语言(如GDScript)时表现出色,能够快速准确地解决问题,甚至优化了我的代码。此外,Qwen在GitHub Actions自动化打包等复杂任务上的表现同样令人满意。其高效的代码补全速度更是超越了付费的GitHub Copilot。这次体验让我对开源AI工具刮目相看,强烈推荐大家试用。
|
16天前
|
人工智能 自然语言处理 机器人
“今日热点:AI像人类一样使用手机和电脑”,魔搭社区的开源项目已先行一步
今天,Claude发布了Computer Use的新功能,可以让AI像人一样使用电脑!
|
人工智能 自然语言处理 JavaScript
重磅!GitHub 推出 AI 自动写代码神器,再也不用到处找代码了…
大家好,我是你们的码农大哥——栈长。 3 年前,自 微软收购 Github 后大动作不断啊,两年多之前就让 Github 私库免费了!,后面还推出了 Github for Mobile 移动版,这些我都已经在公众号Java技术栈作过分享,没看过的可以回过头看下。 最近,Github 又搞大事了,推出了一款 AI 编程神器——Github Copilot,牛逼啊,下面栈长带大家来看看到底是什么鬼?
951 0
重磅!GitHub 推出 AI 自动写代码神器,再也不用到处找代码了…
|
28天前
|
编解码 Oracle Java
java9到java17的新特性学习--github新项目
本文宣布了一个名为"JavaLearnNote"的新GitHub项目,该项目旨在帮助Java开发者深入理解和掌握从Java 9到Java 17的每个版本的关键新特性,并通过实战演示、社区支持和持续更新来促进学习。
64 3
|
3月前
|
SQL JavaScript 前端开发
Github 2024-08-05 开源项目周报 Top15
根据 Github Trendings 的统计,本周(2024年8月5日统计)共有15个项目上榜。以下是根据开发语言汇总的项目数量: - Go 项目:4个 - JavaScript 项目:3个 - Python 项目:3个 - Java 项目:2个 - TypeScript 项目:2个 - C 项目:1个 - Shell 项目:1个 - Dockerfile 项目:1个 - 非开发语言项目:1个
86 2
|
3月前
|
人工智能 Rust JavaScript
Github 2024-08-26 开源项目周报Top15
根据Github Trendings的统计,本周共有15个项目上榜。以下是按开发语言汇总的项目数量:Python项目8个,TypeScript、C++ 和 Rust 项目各2个,Jupyter Notebook、Shell、Swift 和 Dart 项目各1个。其中,RustDesk 是一款用 Rust 编写的开源远程桌面软件,可作为 TeamViewer 的替代品;Whisper 是一个通用的语音识别模型,基于大规模音频数据集训练而成;初学者的生成式人工智能(第2版)则是由微软提供的18门课程,教授构建生成式AI应用所需的知识。
120 1

热门文章

最新文章