MiniGPT4,开源了!

简介: MiniGPT4,开源了!


GPT-4识图功能迟迟不开放,终于有人忍不住自己动手做了一个。

MiniGPT-4来了,Demo开放在线可玩。

传一张海鲜大餐照片上去,就能直接获得菜谱。

传一张商品效果图,就可以让AI写一篇带货文案。

手绘一个网页,可以给出对应的HTML代码

除了生产力拉满,也支持根据常识推理图上内容是否合理、解释表情包为什么好笑,以及看截图找电影等娱乐玩法。

可以说,GPT-4发布时展示过的功能,MiniGPT-4基本也都有了。

这下网友直接把Demo服务器挤爆,开发团队连开4台备用服务器,都有几十人在排队。

不等OpenAI了,现在就能玩

除了研究团队给出的示例,网友也用MiniGPT-4玩出了各种花样

有人上传自己画的画,让AI评价评价。

有人上传一张从车道拍摄的飞机坠毁瞬间,让MiniGPT-4尽可能详细地描述,并思考自动驾驶AI能不能理解这个场面。

做到这么好的效果,MiniGPT-4实现起来却并不复杂。

把图像编码器与开源语言模型Vicuna(小羊驼)整合起来,并且冻结了两者的大部分参数,只需要训练很少一部分。

传统预训练阶段,使用4张A100在10个小时内就可完成,此时训练出来的Vicuna已能够理解图像,但生成能力受到很大影响。

为解决这个问题,团队让MiniGPT-4与ChatGPT合作创建了3500个图像文本的高质量数据集,也一并开源。

用新的数据集微调可以显著提高模型的生成可靠性和整体可用性,而且计算效率很高,使用单个A100只需要7分钟。

并且团队正在准备一个更轻量级的版本,部署起来只需要23GB显存。

也就是消费级显卡中拥有24GB显存的3090或4090就可以本地运行了。

MiniGPT-4开发团队来自KAUST(沙特阿卜杜拉国王科技大学),包括4位华人成员和他们的导师 Mohamed Elhoseiny。


相关文章
|
JavaScript Linux 编译器
c++开源协程库libgo介绍及使用
c++开源协程库libgo介绍及使用
|
11月前
|
前端开发 API 开发者
【raETable】🎉开源啦!开源啦!开源啦!🎉
【raETable】🎉开源啦!开源啦!开源啦!🎉
|
数据处理 开发工具
开源开源啦
开源开源啦
71 0
|
程序员
把自己开源了
用文字或视频记录自己的生活和想法,让我突然有种感觉,像是把自己给“开源”了。
166 0
|
关系型数据库 Linux 程序员
关于开源,你必须知道的: "君子协定"
为什么在一个技术论坛里冒出这篇法律和知识产权相关的分享呢? 因为,开源和自由软件是推动社会技术发展的重要力量,作为一个优秀的程序员,你一定会接触,学习和使用到开源软件,所以是一定要知道开源界最基本的游戏规则的
12273 1
|
Web App开发 测试技术 C#
C#开源汇总
原文:C#开源汇总 商业协作和项目管理平台-TeamLab 网络视频会议软件-VMukti 驰骋工作流程引擎-ccflow 【免费】正则表达式测试工具-Regex-Tester Windows-Phone-7-SDK Excel-读写组件-ExcelLibrary .
5380 0
|
大数据 云计算 Cloud Native