达摩院联合高德发布业界首个多模态地理文本预训练模型MGeo,并在ModelScope社区开源!

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 达摩院联合高德发布业界首个多模态地理文本预训练模型MGeo,并在ModelScope社区开源!

2月21日,达摩院联合高德发布业界首个多模态地理文本预训练模型MGeo,其可充分理解地图上的每一个元素,并精准完成地图搜索、地理位置分析等任务。MGeo是阿里通义模型系列旗下的新模型,目前已在魔搭社区开放(https://modelscope.cn/models/damo/mgeo_backbone_chinese_base/summary)。

地理文本信息处理是导航软件、物流以及零售等行业的基础。然而,目前传统地理文本AI算法对于地理信息的理解仍局限在经纬度以及经纬度的远近上,无法像人类一样理解地图上的元素,该方法难以精准表示景区、园区、商业街等大型地理实体的具体形状,以及不同地图元素之间复杂的临近、包含等关系。

针对上述问题,达摩院联合高德提出地理文本多模态模型,使用对抗MLM预训练、句子对预训练及多模态预训练三大技术,并用多任务预训练将这三种预训练任务进行动态组合,最终训练得到适合于多类地理文本任务的预训练底座MGeo。该模型拥有丰富的地理知识,能像人类一样跨模态理解地图与地理文本的信息,相关研究成果已被EMNLP、AAAI等国际顶级会议收录。

image.png

MGeo像人类一样具备跨模态理解能力,可识别地图元素之间的位置关系

据悉,高德基于MGeo研发了全新的模型,不仅显著提高泛化语义的表示能力,还可准确识别不同地图元素之间的位置关系,有效提升用户的搜索体验。例如,当用户在杭州输入“星光荟对面中国美术”时,MGeo能根据位置关系准确定位到中国美术学院象山校区,而传统BERT模型则给出了错误定位结果;此外,在用户书写有误的情况下,该模型也能匹配正确的结果。该能力已逐步在高德灰度上线。

image.png

在四平市搜索“佣兵小区”,高德可准确定位“拥军社区”

达摩院语言技术实验室负责人黄非表示:“地理信息与AI的融合已是业界公认的趋势,但传统AI比如文本处理在地理信息应用场景中有一定局限性 ,我们需要让AI学习人类对于空间信息的理解范式,例如,通过地图中的地理实体以及他们之间的关系来判定地理文本中各个元素的归属以及指向。”

作为最早投入预训练语言模型研究的团队之一,达摩院研发了阿里通义AliceMind,该体系涵盖预训练模型、多语言预训练模型、超大中文预训练模型等,具备阅读理解、机器翻译、对话问答、文档处理等多种能力,该模型体系已斩获36项国际赛事冠军。

相关文章
|
自然语言处理
在ModelScope中,你可以通过设置模型的参数来控制输出的阈值
在ModelScope中,你可以通过设置模型的参数来控制输出的阈值
484 1
|
11月前
|
人工智能 物联网
如何将Together AI上基于Qwen2-7B训练的模型部署到ModelScope平台
如何将Together AI上基于Qwen2-7B训练的模型部署到ModelScope平台
252 10
|
自然语言处理 监控 API
"阿里云ModelScope深度测评:从预训练模型到一键部署,揭秘高效模型开发背后的秘密,开发者必备利器!"
【10月更文挑战第23天】阿里云ModelScope是一款便捷的模型开发、训练、部署和应用平台。它提供丰富的预训练模型,涵盖自然语言处理、计算机视觉等领域,支持一键式模型训练和部署,具备模型版本管理和监控功能,显著降低开发门槛,提高模型应用效率。
613 0
|
人工智能 物联网 大数据
开源大赛 | 第七届CCF开源创新大赛ModelScope赛题解读
第七届CCF开源创新大赛由CCF主办,长沙理工大学和CCF开源发展委员会联合承办,以国家“十四五”开源生态发展战略布局为导向,重点关注人工智能、大数据、芯片设计、物联网等领域的开源软件,旨在创建一个展示、交流和合作的平台,激发开源创新精神,培养开源人才,并促进高质量的开源生态系统建设。
|
人工智能 开发框架 物联网
赢万元奖金 | 第七届CCF开源创新大赛ModelScope开源模型应用挑战赛开启报名!
第七届CCF开源创新大赛(后简称“大赛”) 由中国计算机学会(CCF)主办,长沙理工大学、CCF开源发展委员会联合承办。
|
存储 缓存 API
Modelscope-Agent 增强RAG能力:(一)多策略召回、多模态召回
Modelscope-Agent是魔搭GPTs 开源的实现方案的底层框架,基于chatbot允许用户通过聊天、直接配置的方式进行agent的定制生成,可以允许用户使用自定义知识库以及接入多工具的能力。
|
人工智能 开发工具 Swift
ModelScope联手OpenDataLab:直接调用7000+开源数据集,赋能AI模型加速研发
魔搭社区和OpenDatalab浦数合作,共同开启一场模型与数据的深度融合,旨在为中国开发者打造更加高效、开放的AI体验。
|
数据采集 机器学习/深度学习 人工智能
阿里云魔搭社区发起ModelScope-Sora开源计划
阿里云魔搭社区在2024全球开发者先锋大会上启动ModelScope-Sora开源计划,聚焦中国多模态大模型研究,推出一站式工具链和Data-Juicer多模态数据处理系统,提升处理效率与质量。该计划还包括基础类Sora模型开源及沙盒实验室,以支持开发者迭代与训练。面对数据质量、安全、商业平衡及算力挑战,魔搭社区致力于推动AI创新,已汇聚众多模型与开发者。
1461 1
阿里云魔搭社区发起ModelScope-Sora开源计划
|
开发框架 API 决策智能
ModelScope-Agent框架再升级!新增一键配置多人聊天,配套开源多智能体数据集和训练
ModelScope-Agent是魔搭社区推出的适配开源大语言模型(LLM)的AI Agent(智能体)开发框架,借助ModelScope-Agent,所有开发者都可基于开源 LLM 搭建属于自己的智能体应用。在最新升级完Assistant API和Tool APIs之后,我们又迎来了多智能体聊天室的升级,通过几分钟快速配置即可搭建一个全新的聊天室。
|
机器学习/深度学习 测试技术 TensorFlow
ModelScope模型使用与EAS部署调用
本文以魔搭数据的模型为例,演示在DSW实例中如何快速调用模型,然后通过Python SDK将模型部署到阿里云PAI EAS服务,并演示使用EAS SDK实现对服务的快速调用,重点针对官方关于EAS模型上线后示例代码无法正常调通部分进行了补充。
577 2

热门文章

最新文章