『GitHub项目圈选17』推荐5款本周 火火火 的AI开源项目

简介: 『GitHub项目圈选17』推荐5款本周 火火火 的AI开源项目

1、EMO


EMO 是阿里巴巴智能计算研究所在本周发布的一款全新的生成式AI视频模型。


使用也非常简单,只需上传一张人物肖像照片和任意一个音频文件,就能生成一个让照片中人物按照音频内容“张嘴”说话或唱歌,而且口型还原程度非常高,表情自然,毫无违和感。


网友感叹:“阿里是有一些技术在身上的。”


Star:4.7k


项目地址:https://github.com/HumanAIGC/EMO


该项目目前还是空代码,但是关注的人已经非常多了。


2、LayerDiffusion


LayerDiffusion 是一种利用大规模预训练的潜在扩散模型(如Stable Diffusion)生成透明图像的技术,可以帮助用户生成单个透明图像或多个透明图层。


不仅支持直接生成透明的图片元素,还支持在已有图片上生成跟环境融合的透明图片。


目前官方直接推出了支持forge的模型项目。


forge是WebUI的一个分支,操作逻辑和交互完全跟Web UI一样,不过进行了一些底层修改,让生成速度更快,插件运行时会自动下载模型。


Star:418


项目地址:https://github.com/layerdiffusion/sd-forge-layerdiffusion


3、StickerBaker


StickerBaker 是一个开源的 AI 贴纸制作工具。


结合了 Stickers SDXL Lora 和 BRIA 背景移除工具,你仅需输出简单的提示词,即可快速生成一张高清精美的贴纸。


还有一款与此项目相关的Demo:https://stickerbaker.com/


用做头像或者其他用途非常不错,生成图像具有透明背景,你还能在网站上看到不同的网友实时生成的图像,可以借鉴他们的关键词。


Star:113


项目地址:https://github.com/fofr/cog-stickers

4、青梧字幕


青梧字幕 是一款基于 Whisper 的字幕自动提取工具。


支持智能提取、自由编辑以及高质量翻译字幕等功能,并且支持单/双语字幕下载,同时可选多种字幕格式。


工具完全开源免费,可直接下载整合包使用。


Star:244


项目地址:https://github.com/melon/qingwu-zimu


5、gemma.cpp


gemma.cpp 是谷歌宣布推出的一款新的 AI 语言模型系列。


Gemma 不仅免费、开源,而且采用了与谷歌更为强大的 Gemini 模型类似的技术。


不同于 Gemini,Gemma 模型可以在个人电脑上本地运行,这是自 OpenAI 的 ChatGPT 在 2022 年引发 AI 聊天机器人热潮以来,谷歌首次发布的重要开源 LLM。


Star:4.8k


项目地址:https://github.com/google/gemma.cpp


以上就是本周 GitHub圈选 的5款开源项目,有兴趣的同学可以前往了解探索!!

相关文章
|
2月前
|
编解码 Oracle Java
java9到java17的新特性学习--github新项目
本文宣布了一个名为"JavaLearnNote"的新GitHub项目,该项目旨在帮助Java开发者深入理解和掌握从Java 9到Java 17的每个版本的关键新特性,并通过实战演示、社区支持和持续更新来促进学习。
87 3
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
MMAudio 是一个基于多模态联合训练的高质量 AI 音频合成项目,能够根据视频内容或文本描述生成同步的音频。该项目适用于影视制作、游戏开发、虚拟现实等多种场景,提升用户体验。
44 7
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
|
14天前
|
存储 人工智能 数据库
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
Codel是一款全自主AI代理工具,支持在终端、浏览器和编辑器中执行复杂任务和项目。它运行在沙盒化的Docker环境中,具备自主操作能力,内置浏览器和文本编辑器,所有操作记录存储于PostgreSQL数据库。Codel能够自动完成复杂任务,如创建项目结构、进行网络搜索等,适用于自动化编程、研究与开发、教育与培训以及数据科学与分析等多个领域。
53 11
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
|
26天前
|
人工智能 物联网 Shell
今日 AI 开源|共 12 项|开源的DIY健康追踪项目,基于低成本的智能戒指构建私人的健康监测应用
本文介绍了多个开源项目,涵盖了从量子计算错误纠正到视频生成和编辑的广泛应用领域。这些项目展示了AI技术在不同领域的创新和应用潜力。
151 10
今日 AI 开源|共 12 项|开源的DIY健康追踪项目,基于低成本的智能戒指构建私人的健康监测应用
|
19天前
|
存储 人工智能 缓存
官宣开源 阿里云与清华大学共建AI大模型推理项目Mooncake
近日,清华大学和研究组织9#AISoft,联合以阿里云为代表的多家企业和研究机构,正式开源大模型资源池化项目 Mooncake。
|
20天前
|
存储 人工智能 缓存
官宣开源|阿里云与清华大学共建AI大模型推理项目Mooncake
2024年6月,国内优质大模型应用月之暗面Kimi与清华大学MADSys实验室(Machine Learning, AI, Big Data Systems Lab)联合发布了以 KVCache 为中心的大模型推理架构 Mooncake。
|
1月前
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。
|
1月前
|
人工智能 安全 网络安全
揭秘!大模型私有化部署的全方位安全攻略与优化秘籍,让你的AI项目稳如磐石,数据安全无忧!
【10月更文挑战第24天】本文探讨了大模型私有化部署的安全性考量与优化策略,涵盖数据安全、防火墙配置、性能优化、容器化部署、模型更新和数据备份等方面,提供了实用的示例代码,旨在为企业提供全面的技术参考。
98 6
|
1月前
|
人工智能 JavaScript 前端开发
利用 AI 进行代码生成:GitHub Copilot 的实践与反思
【10月更文挑战第23天】本文探讨了GitHub Copilot,一个由微软和OpenAI合作推出的AI代码生成工具,其核心功能包括智能代码补全、多语言支持、上下文感知和持续学习。文章介绍了Copilot在加速开发流程、学习新语言、提高代码质量和减少重复工作等方面的应用,并反思了AI在代码生成中的代码所有权、安全性和技能发展等问题。最后,文章提供了实施Copilot的最佳实践,强调了在使用AI工具时保持对代码的控制和理解的重要性。
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
探索未来AI趋势:掌握Function Calling技巧,解锁大模型精度提升的秘密武器,让你的数据科学项目事半功倍!
【10月更文挑战第6天】随着深度学习技术的发展,神经网络模型日益复杂,Function Calling作为一种机制,在提升大模型准确度方面发挥重要作用。本文探讨Function Calling的概念及其在大模型中的应用,通过具体示例展示如何利用其优化模型性能。Function Calling使模型能在运行过程中调用特定函数,提供额外的信息处理或计算服务,增强模型表达能力和泛化能力。例如,在文本生成模型中,根据上下文调用词性标注或实体识别等功能模块,可使生成的文本更自然准确。通过合理设计条件判断逻辑和功能模块权重,Function Calling能显著提升模型整体表现。
76 3