『GitHub项目圈选17』推荐5款本周 火火火 的AI开源项目

简介: 『GitHub项目圈选17』推荐5款本周 火火火 的AI开源项目

1、EMO


EMO 是阿里巴巴智能计算研究所在本周发布的一款全新的生成式AI视频模型。


使用也非常简单,只需上传一张人物肖像照片和任意一个音频文件,就能生成一个让照片中人物按照音频内容“张嘴”说话或唱歌,而且口型还原程度非常高,表情自然,毫无违和感。


网友感叹:“阿里是有一些技术在身上的。”


Star:4.7k


项目地址:https://github.com/HumanAIGC/EMO


该项目目前还是空代码,但是关注的人已经非常多了。


2、LayerDiffusion


LayerDiffusion 是一种利用大规模预训练的潜在扩散模型(如Stable Diffusion)生成透明图像的技术,可以帮助用户生成单个透明图像或多个透明图层。


不仅支持直接生成透明的图片元素,还支持在已有图片上生成跟环境融合的透明图片。


目前官方直接推出了支持forge的模型项目。


forge是WebUI的一个分支,操作逻辑和交互完全跟Web UI一样,不过进行了一些底层修改,让生成速度更快,插件运行时会自动下载模型。


Star:418


项目地址:https://github.com/layerdiffusion/sd-forge-layerdiffusion


3、StickerBaker


StickerBaker 是一个开源的 AI 贴纸制作工具。


结合了 Stickers SDXL Lora 和 BRIA 背景移除工具,你仅需输出简单的提示词,即可快速生成一张高清精美的贴纸。


还有一款与此项目相关的Demo:https://stickerbaker.com/


用做头像或者其他用途非常不错,生成图像具有透明背景,你还能在网站上看到不同的网友实时生成的图像,可以借鉴他们的关键词。


Star:113


项目地址:https://github.com/fofr/cog-stickers

4、青梧字幕


青梧字幕 是一款基于 Whisper 的字幕自动提取工具。


支持智能提取、自由编辑以及高质量翻译字幕等功能,并且支持单/双语字幕下载,同时可选多种字幕格式。


工具完全开源免费,可直接下载整合包使用。


Star:244


项目地址:https://github.com/melon/qingwu-zimu


5、gemma.cpp


gemma.cpp 是谷歌宣布推出的一款新的 AI 语言模型系列。


Gemma 不仅免费、开源,而且采用了与谷歌更为强大的 Gemini 模型类似的技术。


不同于 Gemini,Gemma 模型可以在个人电脑上本地运行,这是自 OpenAI 的 ChatGPT 在 2022 年引发 AI 聊天机器人热潮以来,谷歌首次发布的重要开源 LLM。


Star:4.8k


项目地址:https://github.com/google/gemma.cpp


以上就是本周 GitHub圈选 的5款开源项目,有兴趣的同学可以前往了解探索!!

相关文章
|
11天前
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。
|
18天前
|
人工智能 安全 网络安全
揭秘!大模型私有化部署的全方位安全攻略与优化秘籍,让你的AI项目稳如磐石,数据安全无忧!
【10月更文挑战第24天】本文探讨了大模型私有化部署的安全性考量与优化策略,涵盖数据安全、防火墙配置、性能优化、容器化部署、模型更新和数据备份等方面,提供了实用的示例代码,旨在为企业提供全面的技术参考。
53 6
|
18天前
|
人工智能 JavaScript 前端开发
利用 AI 进行代码生成:GitHub Copilot 的实践与反思
【10月更文挑战第23天】本文探讨了GitHub Copilot,一个由微软和OpenAI合作推出的AI代码生成工具,其核心功能包括智能代码补全、多语言支持、上下文感知和持续学习。文章介绍了Copilot在加速开发流程、学习新语言、提高代码质量和减少重复工作等方面的应用,并反思了AI在代码生成中的代码所有权、安全性和技能发展等问题。最后,文章提供了实施Copilot的最佳实践,强调了在使用AI工具时保持对代码的控制和理解的重要性。
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
探索未来AI趋势:掌握Function Calling技巧,解锁大模型精度提升的秘密武器,让你的数据科学项目事半功倍!
【10月更文挑战第6天】随着深度学习技术的发展,神经网络模型日益复杂,Function Calling作为一种机制,在提升大模型准确度方面发挥重要作用。本文探讨Function Calling的概念及其在大模型中的应用,通过具体示例展示如何利用其优化模型性能。Function Calling使模型能在运行过程中调用特定函数,提供额外的信息处理或计算服务,增强模型表达能力和泛化能力。例如,在文本生成模型中,根据上下文调用词性标注或实体识别等功能模块,可使生成的文本更自然准确。通过合理设计条件判断逻辑和功能模块权重,Function Calling能显著提升模型整体表现。
48 3
|
15天前
|
人工智能 Anolis 开发者
|
1月前
|
人工智能 自动驾驶 机器人
【通义】AI视界|苹果自动驾驶汽车项目画上句号:加州测试许可被取消
本文精选了24小时内的重要科技新闻,包括Waymo前CEO批评马斯克对自动驾驶的态度、AMD发布新款AI芯片但股价波动、苹果造车项目终止、Familia.AI推出家庭应用以及AI逆向绘画技术的进展。更多内容请访问通义官网体验。
|
机器学习/深度学习 人工智能 算法
AI项目成功的4要素
如何确保你的项目保持在正轨上。如果你是产品经理,想要用机器学习来做一些事情,这里列出了 4 件最重要的事情
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
AI在医疗领域的应用及其挑战
【10月更文挑战第34天】本文将探讨人工智能(AI)在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念入手,然后详细介绍其在医疗领域的各种应用,如疾病诊断、药物研发、患者护理等。最后,我们将讨论AI在医疗领域面临的主要挑战,包括数据隐私、算法偏见、法规合规等问题。
27 1
|
6天前
|
机器学习/深度学习 人工智能 算法
AI在医疗领域的应用与挑战
本文探讨了人工智能(AI)在医疗领域的应用,包括其在疾病诊断、治疗方案制定、患者管理等方面的优势和潜力。同时,也分析了AI在医疗领域面临的挑战,如数据隐私、伦理问题以及技术局限性等。通过对这些内容的深入分析,旨在为读者提供一个全面了解AI在医疗领域现状和未来发展的视角。
31 10