『GitHub项目圈选17』推荐5款本周 火火火 的AI开源项目

简介: 『GitHub项目圈选17』推荐5款本周 火火火 的AI开源项目

1、EMO


EMO 是阿里巴巴智能计算研究所在本周发布的一款全新的生成式AI视频模型。


使用也非常简单,只需上传一张人物肖像照片和任意一个音频文件,就能生成一个让照片中人物按照音频内容“张嘴”说话或唱歌,而且口型还原程度非常高,表情自然,毫无违和感。


网友感叹:“阿里是有一些技术在身上的。”


Star:4.7k


项目地址:https://github.com/HumanAIGC/EMO


该项目目前还是空代码,但是关注的人已经非常多了。


2、LayerDiffusion


LayerDiffusion 是一种利用大规模预训练的潜在扩散模型(如Stable Diffusion)生成透明图像的技术,可以帮助用户生成单个透明图像或多个透明图层。


不仅支持直接生成透明的图片元素,还支持在已有图片上生成跟环境融合的透明图片。


目前官方直接推出了支持forge的模型项目。


forge是WebUI的一个分支,操作逻辑和交互完全跟Web UI一样,不过进行了一些底层修改,让生成速度更快,插件运行时会自动下载模型。


Star:418


项目地址:https://github.com/layerdiffusion/sd-forge-layerdiffusion


3、StickerBaker


StickerBaker 是一个开源的 AI 贴纸制作工具。


结合了 Stickers SDXL Lora 和 BRIA 背景移除工具,你仅需输出简单的提示词,即可快速生成一张高清精美的贴纸。


还有一款与此项目相关的Demo:https://stickerbaker.com/


用做头像或者其他用途非常不错,生成图像具有透明背景,你还能在网站上看到不同的网友实时生成的图像,可以借鉴他们的关键词。


Star:113


项目地址:https://github.com/fofr/cog-stickers

4、青梧字幕


青梧字幕 是一款基于 Whisper 的字幕自动提取工具。


支持智能提取、自由编辑以及高质量翻译字幕等功能,并且支持单/双语字幕下载,同时可选多种字幕格式。


工具完全开源免费,可直接下载整合包使用。


Star:244


项目地址:https://github.com/melon/qingwu-zimu


5、gemma.cpp


gemma.cpp 是谷歌宣布推出的一款新的 AI 语言模型系列。


Gemma 不仅免费、开源,而且采用了与谷歌更为强大的 Gemini 模型类似的技术。


不同于 Gemini,Gemma 模型可以在个人电脑上本地运行,这是自 OpenAI 的 ChatGPT 在 2022 年引发 AI 聊天机器人热潮以来,谷歌首次发布的重要开源 LLM。


Star:4.8k


项目地址:https://github.com/google/gemma.cpp


以上就是本周 GitHub圈选 的5款开源项目,有兴趣的同学可以前往了解探索!!

相关文章
|
13天前
|
前端开发
Github项目分享——免费的画图工具drow,最新前端面试题整理
Github项目分享——免费的画图工具drow,最新前端面试题整理
|
1天前
|
人工智能 NoSQL 安全
MongoDB 推出新项目,助力企业构建生成式 AI 现代应用程序
依托 MAAP,我们能够与合作伙伴共同助力客户利用生成式 AI 技术来提高生产率,颠覆客户交互方式,推动行业进步
|
7天前
|
算法 程序员 开发工具
GitHub上新!14个Python项目详细教程(附完整代码)
Python作为程序员的宠儿,越来越得到人们的关注,使用Python进行应用程序开发的也越来越多。 今天给小伙伴们分享的这份项目教程完整代码已上传至GitHub,你可以选择跟着这份教程一段一段的手敲出来这几个项目,也可以直接从GitHub上copy下来。
|
13天前
|
SQL Oracle 前端开发
Oracle效率分析,Github标星25K+超火的前端实战项目
Oracle效率分析,Github标星25K+超火的前端实战项目
|
15天前
|
数据采集 Dart Apache
Github 2024-05-07 Python开源项目日报 Top10
在2024年5月7日的Github Trendings中,Python开源项目占据主导,共有10个项目上榜。其中热门项目包括:yt-dlp,一个增强版的youtube-dl分支,具有64K+星标;Home Assistant,专注本地控制和隐私的开源家庭自动化项目,拥有65K+星标;以及openpilot,一个开源驾驶辅助系统,支持多种车型,45K+星标。其他项目涵盖爬虫工具、实时应用框架Flet、可观测性平台Logfire等,涉及Python、Dart和C++等多种语言。
82 10
|
15天前
|
开发工具 git
Git项目如何配置,如何上传至GitHub。其详细步骤
Git项目如何配置,如何上传至GitHub。其详细步骤
14 0
|
15天前
|
人工智能 安全 Java
安利一个我喜欢的博主(鱼皮)的项目----鱼聪明AI
安利一个我喜欢的博主(鱼皮)的项目----鱼聪明AI
22 0
|
15天前
|
文字识别 异构计算 Python
关于Github中开源OCR项目的实验过程与思考
新手尝试Git clone Python OCR项目,遇到各种报错。测试了Paddle OCR、Tesseract OCR和EasyOCR。Paddle OCR因平台限制未能在Notebook部署,Tesseract OCR在Colab成功但无法复现。EasyOCR最终在阿里云天池和Colab部署成功,但天池GPU资源不足。建议使用魔搭社区的实例,阿里云提供免费OCR服务。寻求简单OCR项目推荐。附EasyOCR安装和使用代码。
55 2
|
15天前
|
人工智能 自然语言处理 iOS开发
『GitHub项目圈选19』推荐5款本周 让人爱不释手 的开源项目
『GitHub项目圈选19』推荐5款本周 让人爱不释手 的开源项目
|
15天前
|
存储 Web App开发 人工智能
『GitHub项目圈选18』推荐5款本周 超实用 的开源项目
『GitHub项目圈选18』推荐5款本周 超实用 的开源项目
155 1