大模型首次接入天文望远镜!基于通义千问,“星语3.0”发布

简介: 大模型首次接入天文望远镜!基于通义千问,“星语3.0”发布


今天,中国科学院国家天文台人工智能工作组发布新一代天文大模型——“星语3.0”


“星语3.0”基于阿里云通义千问开源模型打造,目前已成功接入国家天文台兴隆观测站望远镜阵列--Mini“司天”。这是大模型在科学领域落地的经典案例,也是大模型在天文观测领域的首次应用。



天文望远镜是人类探索宇宙的“照相机”。相比单体望远镜,大型望远镜阵列能更有效地整合高性能望远镜资源,成本更低,观测效率更高。随着望远镜数量的不断增加,如何控制大型望远镜阵列已成为当今天文界共同面临的挑战


以往天文观测主要依赖观测助手和科研人员的配合。科研人员往往需要根据观测所在地气象情况修改观测计划,在观测室等待数据返回并实时分析数据,再根据结果修改观测计划。重要观测目标的每个环节都需要人工参与,效率低且难以同时控制多个望远镜。


“星语3.0”尝试解决这一难题。依托阿里云通义千问底模和百炼平台,“星语3.0”基于超30万专家订正数据完成训练,在天文物理等专业能力上表现突出。


目前,“星语3.0”已成功接入国家天文台兴隆观测站望远镜阵列——Mini“司天”,可实现自主控制望远镜进行观测、分析观测结果,智能地给出下一步观测建议。


例如,当收到“观测某星体”的任务时,“星语3.0”首先查询某星体的坐标信息,反馈给观测人员;当得到确认后,“星语3.0”将按照观测人员输入的计划进行自动观测;单次曝光完成后,大模型将回收并处理数据,根据结果判断目标源的观测价值,推荐接下来的观测计划。


未来,星语大模型将接入国家天文台大型望远镜阵列“司天”(Mini“司天”即为“司天”的一部分)。“司天”是我国天文学家面向时域天文学提出的国家级重大天文基础设施项目,至2030年米级望远镜数量预期达到72架,每晚产生约140TB处理后数据,成为全球巡天效率最高的项目。星语大模型的接入将科研人员从繁琐的观测中解放出来,更加专注于研究。


“全新升级的星语大模型正在向智能体方向发展。”国家天文台人工智能工作组智能体开发方向的李瑀旸表示,“星语将吸收更多天文细分领域知识,融合现有科研模型、算法和成果,打造‘One For All’的天文+AI新范式。星语将降低天文学家在跨方向交流和工作时的门槛,提高科研效率,让天文学家将注意力更多的集中在天文发现上。”


目录
相关文章
|
1月前
|
文字识别 算法 语音技术
基于模型蒸馏的大模型文案生成最佳实践
本文介绍了基于模型蒸馏技术优化大语言模型在文案生成中的应用。针对大模型资源消耗高、部署困难的问题,采用EasyDistill算法框架与PAI产品,通过SFT和DPO算法将知识从大型教师模型迁移至轻量级学生模型,在保证生成质量的同时显著降低计算成本。内容涵盖教师模型部署、训练数据构建及学生模型蒸馏优化全过程,助力企业在资源受限场景下实现高效文案生成,提升用户体验与业务增长。
312 23
|
1月前
|
人工智能 JavaScript 测试技术
Cradle:颠覆AI Agent 操作本地软件,AI驱动的通用计算机控制框架,如何让基础模型像人一样操作你的电脑?
Cradle 是由 BAAI‑Agents 团队开源的通用计算机控制(GCC)多模态 AI Agent 框架,具备视觉输入、键鼠操作输出、自主学习与反思能力,可操作各类本地软件及游戏,实现任务自动化与复杂逻辑执行。
160 6
|
1月前
|
机器学习/深度学习 人工智能 算法
GSPO:Qwen让大模型强化学习训练告别崩溃,解决序列级强化学习中的稳定性问题
这是7月份的一篇论文,Qwen团队提出的群组序列策略优化算法及其在大规模语言模型强化学习训练中的技术突破
571 0
GSPO:Qwen让大模型强化学习训练告别崩溃,解决序列级强化学习中的稳定性问题
|
2月前
|
人工智能 弹性计算 API
再不玩通义 VACE 模型你就过时了!一个模型搞定所有视频任务
介绍通义的开源模型在 ecs 或 acs 场景如何一键部署和使用,如何解决不同视频生成场景的问题。
|
2月前
|
存储 机器学习/深度学习 缓存
阿里云AirCache技术实现多模态大模型高效推理加速,入选国际顶会ICCV2025
阿里云研发的AirCache技术被计算机视觉顶会ICCV2025收录,该技术通过激活跨模态关联、优化KV缓存压缩策略,显著提升视觉语言模型(VLMs)的推理效率与存储性能。实验表明,在保留仅10%视觉缓存的情况下,模型性能下降小于1%,解码延迟最高降低66%,吞吐量提升达192%。AirCache无需修改模型结构,兼容主流VLMs,已在教育、医疗、政务等多个行业落地应用,助力多模态大模型高效赋能产业智能化升级。
231 1
|
2月前
|
人工智能 运维 算法
通义灵码软件工程大模型获顶会最高奖!
近日,软件领域国际顶会ISSTA 2025(International Symposium on Software Testing and Analysis)公布最高奖项-杰出论文奖——「通义灵码软件工程大模型SWE-GPT」成为唯一获得该奖项的企业论文
|
1月前
|
人机交互 API 开发工具
基于通义多模态大模型的实时音视频交互
Qwen-Omni是通义千问系列的全新多模态大模型,支持文本、图像、音频和视频的输入,并输出文本和音频。Omni-Realtime服务针对实时交互场景优化,提供低延迟的人机交互体验。
309 23
|
2月前
|
人工智能 安全 API
用Qwen Code,体验全新AI编程——高效模型接入首选ModelGate
Qwen Code 是通义千问推出的AI编程助手,支持自然语言编程与智能代码生成,大幅提升开发效率。结合 ModelGate,可实现多模型统一管理、安全调用,解决API切换、权限控制、稳定性等问题,是Claude Code的理想国产替代方案。

热门文章

最新文章