MiniGPT-4:无差体验 GPT-4 识图聊天、草图建网站

简介: MiniGPT-4:无差体验 GPT-4 识图聊天、草图建网站

前言


机器之心 & ArXiv Weekly  参与:楚航、罗若天、梅洪源

21.gif

MiniGPT-4:Enhancing Vision-language Understanding with Advanced Large Language Models

正文


摘要:来自阿卜杜拉国王科技大学(KAUST)的团队上手开发了一个 GPT-4 的类似产品 ——MiniGPT-4。MiniGPT-4 展示了许多类似于 GPT-4 的能力,例如生成详细的图像描述并从手写草稿创建网站。此外,作者还观察到 MiniGPT-4 的其他新兴能力,包括根据给定的图像创作故事和诗歌,提供解决图像中显示的问题的解决方案,根据食品照片教用户如何烹饪等。


MiniGPT-4 使用一个投影层将一个冻结的视觉编码器和一个冻结的 LLM(Vicuna)对齐。MiniGPT-4 由一个预训练的 ViT 和 Q-Former 视觉编码器、一个单独的线性投影层和一个先进的 Vicuna 大型语言模型组成。MiniGPT-4 只需要训练线性层,用来将视觉特征与 Vicuna 对齐。


23.png

示例展示:从草图创建网站。

22.gif

相关文章
基于Gradio的GPT聊天程序
这篇文章介绍了如何使用Gradio库创建一个基于ChatGPT的聊天程序,包括详细的代码实现和所需的依赖库。
基于Gradio的GPT聊天程序
|
1天前
|
数据采集 自然语言处理 监控
大模型微调使GPT3成为了可以聊天发布指令的ChatGPT
正是通过微调大模型使得GPT3成为了可以聊天发布指令的ChatGPT。聊天大模型在通用大模型的基础上加一层微调就实现人人能用的大模型,使得通用大模型的能力被更多人使用和了解。
17 4
大模型微调使GPT3成为了可以聊天发布指令的ChatGPT
|
11月前
|
Kubernetes 安全 机器人
私密离线聊天新体验!llama-gpt聊天机器人:极速、安全、搭载Llama 2,尽享Code Llama支持!
私密离线聊天新体验!llama-gpt聊天机器人:极速、安全、搭载Llama 2,尽享Code Llama支持!
私密离线聊天新体验!llama-gpt聊天机器人:极速、安全、搭载Llama 2,尽享Code Llama支持!
|
4月前
|
机器学习/深度学习 人工智能 安全
GPT-4硬核揭秘:能力,操纵性,局限性,聊天GPT Plus等
OpenAI创建了 GPT-4,这是 OpenAI 扩大深度学习努力的最新里程碑...
102 0
|
人工智能 搜索推荐 测试技术
如何使用聊天GPT自定义说明
探索 ChatGPT 自定义说明功能。了解如何微调响应,探索教师、企业家和内容创建者的用例。
271 0
|
人工智能 iOS开发 异构计算
3天近一万Star,无差体验GPT-4识图能力,MiniGPT-4看图聊天、还能草图建网站
3天近一万Star,无差体验GPT-4识图能力,MiniGPT-4看图聊天、还能草图建网站
183 0
|
存储 人工智能 Prometheus
面向GPT-4编程的时代来了:GitHub Copilot大升级,首次集成聊天功能
面向GPT-4编程的时代来了:GitHub Copilot大升级,首次集成聊天功能
660 0
|
2月前
|
存储 SQL 数据库
Python 金融编程第二版(GPT 重译)(四)(4)
Python 金融编程第二版(GPT 重译)(四)
27 3
|
2月前
|
存储 NoSQL 索引
Python 金融编程第二版(GPT 重译)(一)(4)
Python 金融编程第二版(GPT 重译)(一)
36 2
|
2月前
|
存储 机器学习/深度学习 关系型数据库
Python 金融编程第二版(GPT 重译)(四)(5)
Python 金融编程第二版(GPT 重译)(四)
25 2

热门文章

最新文章

下一篇
DDNS