Pangea：卡内基梅隆大学开源的多语言多模态大语言模型

2024-11-28 44

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

图像搜索，7款服务类型 1个月

简介： Pangea是由卡内基梅隆大学团队开发的多语言多模态大型语言模型，支持39种语言，包含高质量英文指令、机器翻译指令及文化相关任务。该模型在多语言和文化背景下的性能超越现有开源模型，适用于多语言客户服务、教育和学习、跨文化交流等多个应用场景。

❤️ 如果你也关注 AI 的发展现状，且对 AI 应用开发非常感兴趣，我会每日跟你分享最新的 AI 资讯和开源应用，也会不定期分享自己的想法和开源实例，欢迎关注我哦！

🥦 微信公众号｜搜一搜：蚝油菜花 🥦

🚀 快速阅读

多语言支持：能理解和生成39种不同语言的文本。
多模态理解：除文本外，能处理和理解图像。
跨文化覆盖：在训练中包含与文化相关的多模态任务。

正文（附运行示例）

Pangea是由卡内基梅隆大学团队推出的多语言多模态大型语言模型（LLM），旨在提升全球语言和文化多样性的覆盖。模型包含600万条指令的多样化数据集，支持39种语言，包含高质量英文指令、机器翻译指令及文化相关任务。

Pangea基于包含14个数据集、覆盖47种语言的PangeaABench评估套件进行性能评估。Pangea在多语言和文化背景下的性能超越现有开源模型（如Llava-1.5-7B、Llava-Next-7B）。研究发现英语数据比例、语言流行度和多模态训练样本数量对性能有显著影响。

公众号: 蚝油菜花 - Pangea

安装依赖：确保安装了所需的依赖。

cd Pangea/train/LLaVA-NeXT
pip install -e ".[train]"

在安装了所需包后，可以运行示例Python代码来使用Pangea-7B。

cd Pangea/predict
python predict_all.py # 可以评估多模态输入和纯文本输入
python predict_multimodal.py # 可以评估多模态输入
python predict_text_only.py # 可以评估纯文本输入

项目官网：https://neulab.github.io/Pangea/
GitHub 仓库：https://github.com/neulab/Pangea
HuggingFace 模型库：https://huggingface.co/collections/neulab/pangea-6713c3b0d78a453906eb2ed8
arXiv 技术论文：https://arxiv.org/pdf/2410.16153
在线体验Demo：https://huggingface.co/spaces/neulab/Pangea

🥦 微信公众号｜搜一搜：蚝油菜花 🥦