创新场景丨后土“量地”,跨模态大模型让自然资源管理有“速度”更有“温度”

简介: “通过需求引领、底座支撑、数字转型、场景驱动、智慧赋能,全面支撑自然资源数字化治理能力提升,最终答好自然资源数字化治理过程中的必答题。

image.png
文/于玮琳

皇天后土,实所共鉴。“后土”是中国古代神话中大地女神的名字,现在,也是自然资源部信息中心和阿里云合作推出的行业大模型的名字。

以最古老的,去定义最先进的;让最创新的,去赋能最广袤的。以“后土”为名,决心不言自明。

后土大模型作为以自然资源和空间对象为核心的“跨模态”垂直行业大模型,跳脱了大模型原有的产业应用范畴,先人一步构建了自然资源行业大模型的总体技术路线,具有里程碑意义。

据了解,从 2023 年立项以来,后土大模型在调查监测、土地规划和用途管制、土地资源要素保障等方面都展现了不俗的潜力。

当大模型成为自然资源数字化治理的必答题,“后土” 到底如何跨越数智化跃迁的又一重鸿沟,让自然资源治理有速度,更有温度?

自然资源数智化,来到大模型拐点

国土空间是民生所系,自然资源是生存之基,而科技发展带来的智能化跃迁,正让我们对自然资源的洞察和利用率上升到新的高度。

中国自然资源信息化发展有过三次飞跃,第一次发生在 1999 年到 2009 年,通过构建国土资源网络体系,实现了从纸质到数字化的转变;第二次发生在 2010 年到 2018 年,国土资源上“云”,打破部门之间的数据孤岛,实现国土资源“一张图”;第三次发生在 2018 年 到 2023 年,随着国土资源向自然资源全体系拓展,一张图从二维到三维,搭建起国土空间基础信息平台,并在平台之上构建了三大应用体系。

依托数字化进步,国土空间和自然资源的治理效率加速度发展,新的拐点就在“AI 大模型”。

在国土空间规划中有“三规合一”的说法,是指将国民经济和社会发展规划、土地利用总体规划、城乡总体规划这三大规划进行整合,以实现城乡空间布局的衔接与协调。由此,可以形成统一、协调、高效的国土空间开发保护格局,有助于提升国土空间治理能力和水平,促进经济社会的可持续发展。

现实中,“三规”之间往往缺乏有效衔接,在同一城市空间内也面临多部门交叉规划,造成管理和建设成本增加。而 AI 大模型可以从数据整合与分析、规划编制与优化、规划实施与监督到提升规划的科学性和透明度等多个方面为“三规合一”提供强有力的支持。

2023 年 9 月,自然资源部印发的《全国国土空间规划实施监测网络建设工作方案(2023-2027 年)》中明确指出:“建设国土空间规划专业大模型”、“建立健全模型安全评估认证机制,形成跨场景、跨业务、跨数据协同共治的大模型能力。”

一个“跨”字成为题眼。大模型是新时代的水电煤,其价值的实现一定是在产业领域。传统的小模型结合人工的效率、准确率都有待提升,而通用大模型在自然资源业务知识方面存在一定短板,知识更新慢,也无法满足数据安全保密要求。

让有能力、有算力的大模型厂商,和拥有丰富语料知识、专家资源的企事业单位,跨领域协同做出适用于自然资源治理场景的产业大模型,是必经之路。

“后土”立项,恰逢其时。这是以自然资源知识和空间对象为核心的“跨模态”大模型,其技术框架,包括四横:算力(智能算力基础设施)、数据(语料和知识中心)、算法(行业大模型训练中心)、应用(大模型应用研发中心),以及两纵:大模型开放数字生态体系和大模型能力评估和安全防护体系。它不仅包括语言、视觉、多模态、科学计算等,也包括智能算力、语料处理、智能应用等一系列相关技术。

经过一年多的合作实践,“后土”已经初具成效。

一个可能突破的典型场景是调查监测。据自然资源部信息中心副主任吴洪涛介绍,中国每年要对 960 万平方公里的土地和几百万平方米的海域进行两次比例尺精确到 1:5000 的详细调查,最常用的是用卫星遥感技术进行调查监测。

过去,通过遥感影像识别国土空间要素,识别率大概能到 70% 左右,而借助后土大模型,提升了对复杂自然环境变化的识别能力,则可以在一级地类达到 90%,二级地类达到 85% 以上。

从更微观的场景来看,AI 大模型每一次对效率的提升,都意味着对人力的大幅解放。

退耕还林、退田还草、退牧还湖,这些人们耳熟能详的词语背后,是执法监察的大量工作。每一块土地都要在规定的用途内被使用,才能保证人与自然的和谐发展。但实际上,土地非法改变用途屡禁不止。

过去,相关监管部门是通过卫星发现疑似非法用地的图斑,再派调查员去取证,通过现场拍照、层层上报、判定是否违法。每年案例量达千万级,占用了大量的人力和物力。

“通过后土大模型的能力,一方面可以自动化去识别图片内容,另一方面,作为多模态大模型,它可以在最快的时间给出一个定量、定性的评估结果作为参考。”阿里云相关技术负责人介绍说。

后土大模型不仅让自然资源治理有速度,也让相关部门在和民众沟通、交互的过程中更有温度。

“过去,人们查询房产登记信息要去网站上搜索,打电话问。”吴洪涛介绍,“现在借助AI大模型和全城网办、跨省通办的能力,可以主动推送资料,甚至帮助群众在网上填写提交资料。”

无论人工智能的发展,还是自然资源利用率的提升,归根结底都是以人为本,殊途同归,吴洪涛总结,“我们摸索出 AI 赋能自然资源管理的核心就两条,一是如何为人民服务,二是如何让内部的管理决策更科学、优化。”

令人欣喜的成果背后,这款敢为人先的自然资源领域多模态行业大模型是一场双向奔赴的探索。

后土闯关,让数智化底座和应用场景双向奔赴

和大模型应用相对成熟的金融、法律等行业相比,自然资源和国土空间的数智化跃迁,是从文本到空间的跨越,存在数据密度大、场景密度大等难题,综合双方优势,协同解决至关重要。

“在应用场景方面,模型能力决定了下限,场景适配度则决定了上限。构建自然资源行业大模型,需要基础底座与应用场景双向奔赴。”在 2024 年 8 月的一场行业交流中,自然资源部信息中心大数据应用中心副处长肖飞这样说。

而在双向奔赴的过程中,遇到的第一重难题是涉密信息如何处理。“涉及自然资源领域的大量数据,其实是敏感的、甚至是涉密的,尤其是和土地及海洋矿产相关的数据。”阿里云相关技术负责人介绍说。

在合作的过程中,阿里云以后土大模型为基础,打造了一个针对土地征收问答场景的小助手,为了提高回答准确率,就必须让其进行大量的学习,不断调优。但因为数据敏感,尽管项目初期就已收到部委多个下属单位的一万多份文档,但对于整个行业的知识来说还存在不小差距。

对于此,项目组在方法论上采取先用数据样本搭建模型、跑通流程,让客户看到公开数据能够展现出的效果和能力,再进一步部署到内网中去提升模型能力的方式。

找对方法之外,阿里云强大的算力和技术底座,是双向奔赴的基础。

2024 年 9 月,阿里云针对政企业务独特性、敏感性推出了百炼专属版,可基于公共云 VPC 和专有云部署,支持图表、公式、图片、音视频等多模态、非结构数据的解析,帮助政企客户安全快速地开发大模型。

功夫不负有心人,现在“土地征收智能助手”在很多问题上的准确率和全面性都超过了以往回答体系。比如,提问在一些特定情况下可以获得多少征地补偿款,智能助手的回答不仅更为准确,还会列出相关的引用文献资料。

第二重难题则是如何保证后土大模型在应用过程中的专业性和权威性。

毕竟无论土地征收、监察亦或者是矿产资源的开发等,都和国计民生息息相关,容不得一丝一毫的马虎。而很多场景下,又有不少个性化案例,比如同样是土地征收,一样大小的地块,有的是茶园,有的是一栋楼,解决方案也不尽相同。

这种情况下,自然资源部信息中心的专家团队介入就显得格外重要。根据阿里云相关技术负责人的介绍,后土语言大模型能力呈现背后有三重保障。

第一重是收集的政策和基础知识原始文档,项目组把这些内容向量化到知识库中,作为大模型的行业增强储备,不做过多干预,目前已实现采集自然资源基础知识、政策法规、标准规范、办事指南、规划文本等各类文档语料 70 多万份。第二重是经过整理后的行业知识,如知识图谱、术语定义等。第三重是以专家经验进行的问答对、思维链提示等优化举措。

从基础大模型到行业大模型,从来都不是云厂商的单打独斗,而是和行业专家及企事业单位的携手共赢。一方提供算力、人才、基础大模型,另一方带来训练语料、行业知识及场景、专家经验。

目前,双方通力合作组织自然资源行业大模型关键技术研发,已经在以下方面取得一些进展。

一是研发富模态知识文档解析加工技术,实现富模态文档的精准性识别和精细化解析,文字 OCR、段落、表格、图片、公式等识别准确率超过 90%;二是研发自然资源行业大模型知识增强训练技术,构建基于数据增强方法的行业问答数据集,基于 Qwen 系列通用大模型,使用 LoRA 高效参数微调方法,为大模型注入自然资源领域专业知识;三是研发自然资源行业大模型智能体构建技术,建立自然资源行业大模型智能体技术框架,建立可自主检索记忆、推理规划、执行任务、感知环境的智能体。

正如吴洪涛所说:“通过需求引领、底座支撑、数字转型、场景驱动、智慧赋能,全面支撑自然资源数字化治理能力提升,最终答好自然资源数字化治理过程中的必答题。”

构建美丽中国,后土蓄势待发

最近热播的电视剧《小巷人家》中有这样一个根据真实历史背景改编的情节。改革开放初期,为了建设当地经济,平遥市政府准备拆除古城。同济大学建筑系的教授,带领学生们深入当地,以更好的规划方案,既满足了当地建设需求,也保存了平遥古城风貌。在过程中,无论是实地考察、测绘还是改造方案的提出,都消耗了大量的人力和物力,以“艰苦卓绝”来说都不为过。

现如今,自然资源行业的跨模态大模型,不仅局限在文字或者图像,更能够带来创意性的工作辅助。

目前“后土”大模型已具备通过注册规划师考试的知识水平,专业知识能力已超过通用大模型。吴洪涛说,通过生成式图像的能力来辅助规划师,过去需要十几个人两三个月才能做出来的设计图,现在可以做到“分钟级”。

2024 年 1 月,中共中央、国务院发布了《关于全面推进美丽中国建设的意见》,意见指出,建设美丽中国是全面建设社会主义现代化国家的重要目标,也是实现中华民族伟大复兴中国梦的重要内容。

其中在城市绿色低碳发展、优化国土空间开发保护格局、提升城市规划、建设、治理水平等,都有相关的要求指引。

在此背景下,后土大模型不仅可以批量生成符合国土空间规划常识约束下不同风格的设计创意,改变国土工业化、标准化建设带来的“千城一面”;还能通过数据分析和计算,精准刻画人口资源环境等特征,助力智能优化城市设施空间布局,打造以人为本的高品质宜居空间。

伴随 AI 大模型在规划设计、要素保障、调查监测等方面发挥越来越多的辅助和促进作用,美丽中国的蓝图正在徐徐展开,更美的街道、更宜居的城市、更和谐的生态浮现在人们眼前。

在不断闯关升级的过程中,后土大模型将形成以知识中心为底座、行业模型为中心、建设完备的自然资源行业智能应用工厂,来实现底线守护、格局优化、绿色低碳、权益保护等全方位数字化应用场景。

顺利的进展和不断出现的业务实践让自然资源部和阿里云充满信心。

“视觉智能助力国土空间全域数字化,生成式智能打造国土空间个性化,流程智能提升自然资源审批规范化,空间感知智能实现国土空间监管精准化,空间认知智能提升国土空间决策科学化,交互智能让自然资源办事服务更有‘温度’。”谈及未来,吴洪涛充满期待。

延伸阅读

除了国土资源规划,通过大模型能力加持,农田也正焕发智慧农业新活力。

捷佳润基于通义百炼平台、调用通义系列大模型,打造了多款智慧农业领域 AI 应用。“AI 巡园”基于 Qwen- VL-Max,实时采集农田环境数据、农作物图像数据等多维度信息,通过算法结合多模态大模型对信息进行处理分析,实现农场环境和作物生长监测、生成图文一体每日巡园分析报告,为农业生产者提供精准的决策支持;“农科智答”基于 Qwen-Max,通过 RAG 进行检索增强,为农业生产者提供农业前沿 AI 咨询,帮助用户解决农作物病虫害识别、施肥管理、土壤检测等难题,提高生产效率;“土谛 AI”小程序调用 Qwen-72B,为农户提供地块历史气象、积温、积雨等信息数据,以及实时天气预报服务,助力农户高效生产。

目录
打赏
0
0
0
0
36
分享
相关文章
视频平台技术成本控制的量化方法
在线视频平台为用户提供服务时,面临的一个严重的挑战是,如何保证在为用户提供流畅 且稳定播放服务的前提下,尽量降低整体运营成本。本篇文章将围绕上述问题,重点讨论技术实践中的成本控制手段。
视频平台技术成本控制的量化方法
复用性风控:软件复用成本的量化管理
本文分析「复用性」这一概念背后的风险及成因,借助笔者在业务安全和基础安全的经验,提出了一个在软件研发流程中,管理「复用性成本风险」的风险管理模型,希望能为读者在后续的技术决策和软件研发流程提供些许帮助。
151738 5
MM-Eureka:多模态推理新纪元!54K训练量吊打百万级模型,K12数学能力暴增8.2%
MM-Eureka 是由上海人工智能实验室、上海创智学院、上海交通大学和香港大学联合开发的多模态推理模型,通过基于规则的强化学习,显著提升了多模态推理能力,尤其在数据效率和推理准确性方面表现突出。
88 37
MiniCPM-o 2.6:面壁智能开源多模态大模型,仅8B参数量就能媲美GPT-4o,支持实时交互,在ipad等终端设备上运行
MiniCPM-o 2.6 是面壁智能开源的多模态大模型,支持视觉、语音和多模态直播,性能媲美GPT-4o,能够在端侧设备上高效运行。
408 10
MiniCPM-o 2.6:面壁智能开源多模态大模型,仅8B参数量就能媲美GPT-4o,支持实时交互,在ipad等终端设备上运行
【更正版】梯级水光互补系统最大化可消纳电量期望短期优化调度模型
该程序基于文献《梯级水光互补系统最大化可消纳电量期望短期优化调度模型》,构建了以最大化整体可消纳电量期望为目标的梯级水光互补系统短期优化调度模型。模型以机组为最小调度单元,对电站、机组和电网约束进行了精细化建模,并通过分段线性逼近等方法将非线性约束转化为混合整数线性规划问题,在Matlab环境中使用CPLEX求解器进行求解。该模型能够合理调配梯级负荷,提升水电与光伏的互补协调能力,从而提高系统的整体消纳水平。模型包括4个水电站、15台机组和2个光伏群,旨在优化调度方案,实现更高的能源利用率。源代码已修正机组对应关系等问题并发布。
EMMA-X:新加坡科技设计大学推出具身多模态动作模型,使夹爪机器人具备空间推理和任务规划能力
EMMA-X是由新加坡科技设计大学推出的具身多模态动作模型,具备70亿参数,通过在链式思维推理数据上微调OpenVLA创建。该模型结合层次化的具身数据集,增强空间推理和任务规划能力。
143 3
EMMA-X:新加坡科技设计大学推出具身多模态动作模型,使夹爪机器人具备空间推理和任务规划能力
|
3月前
大规模、动态语音增强/分离新基准!清华发布移动音源仿真平台SonicSim,含950+小时训练数据
清华大学研究团队推出SonicSim,一款专为语音增强和分离技术设计的移动音源仿真平台。它基于Habitat-sim开发,能生成高度可定制的合成数据,涵盖多个层次的调整选项,有效解决了现有数据集在数量和多样性上的不足。SonicSim不仅提升了模型训练和评估的真实性和全面性,还通过构建SonicSet基准数据集,进一步推动了该领域的研究进展。
101 20
【免费】基于数据驱动的模型预测控制电力系统机组组合优化
【免费】基于数据驱动的模型预测控制电力系统机组组合优化
考虑区域多能源系统集群协同优化的联合需求侧响应模型(matlab代码)
考虑区域多能源系统集群协同优化的联合需求侧响应模型(matlab代码)