ACL2024 | OceanGPT(沧渊):面向海洋科学任务的大型语言模型初探

简介: 本文提出了为海洋领域打造的大型语言模型OceanGPT,它能够处理面向海洋科学的问答等生成任务。

 

image.gif

我们在去年发布了OceanGPT并初步探索了其在海洋科学问答、内容生成和水下具身智能能力,该工作近期被自然语言处理顶级会议ACL2024(CCF-A类会议)录用为主会论文。近期我们对OceanGPT进行了进一步的优化和升级,并将其中的部分能力以开源形式进行了更新发布,主要能力升级包括:

  1. 在OceanGPT-7b基础上升级发布OceanGPT-14B/2B两个新版本;
  2. 新增基于Qwen2的中文基座的OceanGPT,提供支持中英文双语能力;
  3. 开源了20K规模的海洋大模型指令数据集OceanInstruct;
  4. 新训练OceanGPT-V多模态版本(提供在线演示,即将开源),支持多模态海洋数据(声呐、科学图片等)处理能力。

背景

海洋覆盖了约 71% 的地球表面,它在全球的气候调节、天气模式、生物多样性以及人类的经济发展都扮演着至关重要的角色。海洋科学的研究关注于海洋的自然特性、其变化规律以及与海洋资源开发和利用相关的理论、方法与应用。因此,本文提出了为海洋领域打造的大型语言模型OceanGPT,它能够处理面向海洋科学的问答等生成任务。另外本文还尝试验证大模型模拟操控水下机器人的潜力,初步探索了大模型驱动的水下具身智能的可能实现方法。

OceanGPT的训练(OceanGPT-7B)

image.gif

数据质量是训练海洋领域大模型的关键。为训练OceanGPT,我们收集了海洋科学语料,其包含多个子领域。由于每个子领域和主题都有独特的特征和模式,我们提出了一种名为 DoInstruct的领域指令生成框架,采用多智能体协作的方式来生成海洋科学的指令微调训练数据。这种方式即可以确保数据的专业性和准确性,也能够实现高效并行的数据生成性能。DoInstruct框架利用智能体(如 GPT-3.5-turbo)作为每个海洋主题的专家,主要包含三大类角色:

  • 演化式的数据合成智能体: 具体来说,智能体主要采取两种协同式的策略,一是补充拓展种子样本的背景知识,二是对种子数据包含的知识点进行细化分析增强和改进;
  • 经过微调的文献阅读智能体: 首先对大模型进行微调得到专门用于文献抽取的智能体模型,从而能够使用智能体从海量海洋语料库中提取高质量文本;
  • 确保数据质量的审核智能体: 在这里预定义了特定海洋科学相关的句法和语义规则,通过提示的方式构建该智能体,最后能够过滤数据来确保生成数据的质量。

基于上述得到的指令数据,我们基于开源模型llama2-7b-chat训练得到OceanGPT-7B,其中部分的指令数据已开源到OceanInstructions

image.gif

image.gif

从实验结果可以看到,本文研究的模型在绝大多数任务上优于基线语言模型。与此作为对比,现有的开源大型语言模型并不能够很好地处理一些需要专业知识的海洋任务。另外我们设计的多智能体数据生成框架能够有效地在海洋领域的各个子领域充当专家,这表明OceanGPT在各种海洋领域是更好的专家模型。

image.gif

我们进一步在微调过程融合了一些符号化的机器人控制指令和代码,然后在模拟器中初步验证OceanGPT对于海底机器人控制(比如轨迹规划)的能力,可以为大模型驱动的水下具身智能的实现提供参考。

新升级能力(OceanGPT-14B/2B)

在前述工作基础之上,近期我们对OceanGPT进行了多方面的升级,包括:

1. 对模型基座(基于Qwen和MiniCPM)进行了更新优化并开源发布OceanGPT-14B/7B/2B三个模型,其中2B模型可支持端侧或边缘侧硬件设备部署,以便更好适配海洋环境下端侧或边缘侧的低计算能力设备。

2. 基于Qwen 2.0基座模型,提升模型的中英双语能力。

3. 对海洋指令数据集进行了扩展,覆盖更为广泛海洋领域知识,并基于部分指令数据集开源了海洋指令数据集OceanInstruct(20K)

4. 新训练OceanGPT-V多模态版本(提供在线演示,即将开源),支持多模态海洋数据(声呐、科学图片等)处理能力。

下面以OceanGPT-14B为例,展示模型的部分能力。

如给定中文问题“请生成一份东海海域海底管缆的建设方案”,可以发现OceanGPT具备较好的海洋科学知识问题的回答能力。首先,从生成内容的丰富度而言,OceanGPT从“项目概述”、“建设目标”、“线路规划”、“技术路线”、“环境影响评估与保护”等八个点来阐述问题,比GPT4的逻辑性相对较好,丰富度也更高。其次从细粒度的知识点来说,OceanGPT的回答内容覆盖了相对更多的层次。比如说在问题中提到了“中国东海”,OceanGPT能够结合东海本身的背景来进行分析回答,比如联系到“东海大陆架”、“舟山群岛”以及“日本海盆”等知识概念。与此作为对比,GPT4的生成结果相对模糊,没有结合问题的场景做具体分析。总的来说,OceanGPT具备相对较好的海洋科学知识理解与生成能力。

image.gif

为验证OceanGPT英文生成能力,给定英文输入“请描述东海海域的海底地形地貌特征”。可以看出OceanGPT的描述覆盖了更多的地形地貌类型,如大陆坡、海沟、浅海平原、环礁和珊瑚岛、洋中脊等。而GPT4的描述则相对简单,仅提及了浅海区和深海区。从深度和专业性的角度来看,OceanGPT不仅描述了地形,还提供了具体的深度信息和相关地质特征,如日本海沟的深度和琉球海脊的地质成因,使得描述更加专业和科学。最后,OceanGPT清晰地划分了东海的不同地貌区域,并逐一进行详细描述,使得读者更容易理解东海海域的地形地貌特征。相比之下,GPT4的描述较为笼统且没有区域划分。通过以上对比分析可以看出,OceanGPT生成的描述在细节、全面性、专业性和区域划分上相对较好,能够提供更为准确和深入的海底地形地貌信息。

image.gif

oceangpt -small-original.gif

相关文章
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
清华EconAgent获ACL 2024杰出论文:大模型智能体革新计算经济学研究范式
近年来,人工智能的迅猛发展推动了数据驱动建模在宏观经济学领域的应用。清华大学研究团队提出的EconAgent模型,基于大型语言模型,具备类似人类的决策能力,能更准确地模拟个体行为对宏观经济系统的影响。EconAgent在个体异质性、市场动态及宏观经济因素模拟方面表现出色,并具有更好的可解释性和灵活性。然而,其高计算复杂度和部分决策过程的不透明性仍需进一步解决。该成果已在ACL 2024会议上获得杰出论文奖。论文链接:https://arxiv.org/abs/2310.10436v4
111 3
|
10天前
|
机器学习/深度学习 测试技术
LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘
近日,字节跳动豆包大模型团队发布论文,探讨视频生成模型(如类Sora模型)在理解物理规律方面的能力,引起广泛关注并获Yann LeCun点赞。研究通过2D模拟平台测试扩散模型,发现其在分布内表现优异,但在分布外和组合泛化上存在不足,揭示了基于案例的泛化和特征优先级机制。这表明,仅靠视觉数据难以学习到真正的物理规律,未来需引入物理先验知识以提升模型性能。
40 16
|
2月前
|
机器学习/深度学习
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
【10月更文挑战第21天】在科技快速发展的背景下,机器学习研究面临诸多挑战。为提高研究效率,研究人员提出了MLR-Copilot系统框架,利用大型语言模型(LLM)自动生成和实施研究想法。该框架分为研究想法生成、实验实施和实施执行三个阶段,通过自动化流程显著提升研究生产力。实验结果显示,MLR-Copilot能够生成高质量的假设和实验计划,并显著提高任务性能。然而,该系统仍需大量计算资源和人类监督。
43 4
|
4月前
|
机器学习/深度学习 人工智能 算法
首个像人类一样思考的网络!Nature子刊:AI模拟人类感知决策
【9月更文挑战第8天】近日,《自然》子刊发表的一篇关于RTNet神经网络的论文引起广泛关注。RTNet能模拟人类感知决策思维,其表现与人类相近,在反应时间和准确率上表现出色。这项研究证明了神经网络可模拟人类思维方式,为人工智能发展带来新启示。尽管存在争议,如是否真正理解人类思维机制以及潜在的伦理问题,但RTNet为人工智能技术突破及理解人类思维机制提供了新途径。论文详细内容见《自然》官网。
83 3
|
5月前
|
存储 机器学习/深度学习 测试技术
模型量化技术综述:揭示大型语言模型压缩的前沿技术
在这篇文章中,我将在语言建模的背景下介绍量化,并逐一探讨各个概念,探索各种方法论、用例以及量化背后的原理。
77 0
模型量化技术综述:揭示大型语言模型压缩的前沿技术
|
8月前
|
搜索推荐 安全 物联网
【大模型】LLMs被广泛地融入日常生活的未来场景分析
【5月更文挑战第7天】【大模型】LLMs被广泛地融入日常生活的未来场景分析
【大模型】LLMs被广泛地融入日常生活的未来场景分析
|
8月前
|
机器学习/深度学习 自然语言处理 安全
18LLM4SE革命性技术揭秘:大型语言模型LLM在软件工程SE领域的全景解析与未来展望 - 探索LLM的多维应用、优化策略与软件管理新视角【网安AIGC专题11.15】作者汇报 综述
18LLM4SE革命性技术揭秘:大型语言模型LLM在软件工程SE领域的全景解析与未来展望 - 探索LLM的多维应用、优化策略与软件管理新视角【网安AIGC专题11.15】作者汇报 综述
724 0
|
人工智能
【2023】COMAP美赛数模中的大型语言模型LLM和生成式人工智能工具的使用
【2023】COMAP美赛数模中的大型语言模型LLM和生成式人工智能工具的使用
152 0
|
机器学习/深度学习 人工智能 算法
大型语言模型教会智能体进化,OpenAI这项研究揭示了二者的互补关系
大型语言模型教会智能体进化,OpenAI这项研究揭示了二者的互补关系
167 0
|
机器学习/深度学习 人工智能 编解码
「炼丹必备」15个常用基准数据集含大规模中文多模态理解、医疗信息处理等场景(2)
「炼丹必备」15个常用基准数据集含大规模中文多模态理解、医疗信息处理等场景
400 0