上海创智学院联合无问芯穹发布Megrez2.0,本征架构突破端模型不可能三角,以终端算力撬动云端智能

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 终端是实现数字智能和生命智能自由交互的重要接口,持续帮助人类拓展生产能力的边界。当下,终端智能面临着“能效-空间-智能”的不可能三角:以DeepSeek-R1为例,其参数规模高达6710亿,超出了大部分笔记本电脑的内存容量;即使勉强在一台笔记本电脑上成功运行满血版模型,理论上坚持不到9分钟就会耗尽电池;如果通过蒸馏,将满血版模型压缩到更小尺寸,此时的精度损失又可能满足不了智能水平的要求。

终端是实现数字智能和生命智能自由交互的重要接口,持续帮助人类拓展生产能力的边界。当下,终端智能面临着“能效-空间-智能”的不可能三角:以DeepSeek-R1为例,其参数规模高达6710亿,超出了大部分笔记本电脑的内存容量;即使勉强在一台笔记本电脑上成功运行满血版模型,理论上坚持不到9分钟就会耗尽电池;如果通过蒸馏,将满血版模型压缩到更小尺寸,此时的精度损失又可能满足不了智能水平的要求。

 

针对上述挑战,7月24日,无问芯穹发布终端本征大模型Megrez2.0,它在实现21B参数,也就是云端级智能水平的同时,将实际计算量控制在3B、内存占用控制在7B规模,从而可以完美地适配当下的各类终端设备,成功打破了终端“能效-空间-智能”的不可能三角。

 

模型链接:

https://www.modelscope.cn/models/InfiniAI/Megrez2-3x7B-A3B-Preview/summary

image.gif 编辑

image.gif 编辑

终端本征架构

打破“能效-空间-智能”的不可能三角

传统稠密模型在端侧的黄金尺寸是3B,这个尺寸即可以较好的契合端侧有限的算力和存储,又具有基础的智能水平。但若继续增大尺寸,端侧的推理速度会快速下降。

 

如何让3B的算力发挥更大的智能?主流的方式是MoE,即通过参数冗余和动态激活,为模型精度加杠杆。例如一个总参数量21B,激活参数量3B大小的模型,虽然只有3B计算量,但理论精度潜力高达21B,实际也有7~14B的精度表现。但这21B的总参数量对于端侧太过巨大,如果全部放在外存,外存较低的带宽速率会带来Decode速度指数级下降,而如果限制模型激活参数的locality将部分参数放入内存,又会与MoE的动态多样性与平衡性相违背,带来精度下降。

 

无问芯穹本次提出的终端本征架构,引入了重参数机制,将若干个相邻MoE层划成一组,复用Expert专家参数。这样一个原本30层MoE层的模型,原始总参数量21B。现在每3层共享参数相互复用,模型的实际总参数量下降到21/3即7B大小,但激活可用的专家池空间仍为21B。

 

此外,本次发布的Megrez 2.0为Preview版本,虽然训练数据量只有5T Tokens,但已表现出优异的精度潜力。相较于国内外主流的端侧模型,我们的模型速度相比同内存占用的模型快50%,精度比同尺寸稠密模型提升36%,内存则是比同精度模型节约75%,真正做到高能效、少内存、高智能。

 

Benchmark

Megrez2-3x7B-A3B-Preview

Qwen3-8B

Phi-4-mini

MMLU-Pro

67.6

-

52.8

IF-Eval

80.2

83

68.6

 

终端本征智能应用落地

打破AI的时空能动性边界

 

当端侧级算力撬动起云侧级模型的智能水平,智能体等AI应用将得以在端侧释放更大的能动性。Megrez2.0加持的终端设备,代理任务处理准确率高达95%,复杂代理任务端侧处理时间只需不到3分钟。此外,Megrez2.0还通过巧妙的工程设计,赋予终端设备更强的能动性,使设备在用户无感知的休眠时段里,也能持续创造价值。

 

发布会现场,Megrez2.0的研发团队为大家带来了一个令人激动的演示——用户在电脑合盖之前给出语音指令“整理今日会议记录”。电脑合盖后,系统自动调度闲置CPU周期执行后台任务,等任务完成后,则自动释放内存并转入待机。唤醒设备时,整理好的会议纪要已完整呈现在电脑上,算力亦能瞬时恢复满血状态,并且全程无唤醒、无联网、无发热。

 

Megrez 2.0 坚信,端侧智能体蕴藏着无限可能。它的推出,旨在解锁端侧智能的全新图景:让云端级智能真正落地于端侧设备。由此,智能体等先进 AI应用得以在用户指尖、设备本地获得更多生长空间,随用户个性而进化捕捉用户更多偏好并完成智能自主进化,释放前所未有的能动性——自由、高效且无处不在。

目录
相关文章
|
存储 前端开发 BI
基于云计算技术的B/S架构智能云HIS系统源码 集挂号、处方、收费、取药、病历于一体
云HIS是针对中小医院机构、乡镇卫生室推出的一套基于云端的云HIS服务平台,借助云HIS,将医院业务流程化,大大提高医院的服务效率和服务质量,为客户提供医院一体化的信息解决方案。云HIS主要功能:包含门诊收费管理,住院收费管理,门诊医生工作站,住院医生工作站,住院护士工作站,辅助检查科室管理,药房药品管理,药库药品管理,报表查询。满足诊所、中小医院业务中看诊、收费、发药、药库管理、经营分析等多环节的工作需要。
233 4
|
26天前
|
机器学习/深度学习 人工智能 运维
云架构不是养祖宗,智能运维教你省心又省钱
云架构不是养祖宗,智能运维教你省心又省钱
53 2
|
3月前
|
数据采集 机器学习/深度学习 自然语言处理
智能风险管理的技术架构:2025从数据采集到自主决策的全链路解析
本文系统梳理了项目风险管理的技术演进历程,从文档驱动到智能化阶段,深入解析各时期关键技术与工具架构,并结合实践案例提出前瞻性实施策略,助力项目管理专业人士构建智能风险管理体系。
157 2
|
3月前
|
人工智能 物联网 测试技术
智能化测试基础架构:软件质量保障的新纪元
本文介绍了智能化测试基础架构的核心构成与优势。该架构融合AI、领域工程与自动化技术,包含智能测试平台、测试智能体、赋能引擎和自动化工具链四部分,能自动生成用例、调度执行、分析结果,显著提升测试效率与覆盖率。其核心优势在于实现专家经验规模化、质量前移和快速适应业务变化,助力企业构建新一代质量保障体系。建议从构建知识图谱和试点关键领域智能体起步,逐步推进测试智能化转型。
|
3月前
|
存储 边缘计算 数据处理
面向智能医疗的边缘计算与云计算融合架构的设计与实现
边缘+云混合部署架构正在为AIoT与医疗领域带来前所未有的技术变革。通过这种架构,能够实现对海量数据的实时处理和深度分析,提升业务响应速度和效率,同时在保障数据安全的基础上,优化系统的可扩展性和可靠性。随着技术的发展,边缘+云架构的应用场景将愈发广泛,未来必将在更多领域内发挥巨大的潜力。
|
机器学习/深度学习 数据采集 人工智能
揭秘!47页文档拆解苹果智能,从架构、数据到训练和优化
【8月更文挑战第23天】苹果公司发布了一份47页的研究文档,深入解析了其在智能基础语言模型领域的探索与突破。文档揭示了苹果在此领域的雄厚实力,并分享了其独特的混合架构设计,该设计融合了Transformer与RNN的优势,显著提高了模型处理序列数据的效能与表现力。然而,这种架构也带来了诸如权重平衡与资源消耗等挑战。苹果利用海量、多样的高质量数据集训练模型,但确保数据质量及处理噪声仍需克服。此外,苹果采取了自监督与无监督学习相结合的高效训练策略,以增强模型的泛化与稳健性,但仍需解决预训练任务选择及超参数调优等问题。
293 66
|
7月前
|
机器学习/深度学习 数据采集 Java
基于DeepSeek与RAG的智能天气预报系统架构设计与Java实现
基于DeepSeek与RAG的智能天气预报系统架构设计与Java实现
304 3
|
7月前
|
运维 安全 弹性计算
基于阿里云的开源应用智能管理架构设计与工程实践
本文以Websoft9技术方案为例,探讨企业级应用管理的范式。通过解析开源应用管理面临的部署复杂性、运维低效性和知识碎片化三大挑战,提出基于阿里云的三层架构:智能应用管理门户、核心功能层和基础设施层。文章详细阐述了应用编排标准化(IaC实践)、智能运维体系构建及知识资产数字化的技术实现路径,并结合金融与制造行业的案例,展示解决方案的实际效果。最后提供开发者资源与工具链支持,助力企业高效管理应用。
240 1
|
10月前
|
机器学习/深度学习 算法 数据可视化
基于深度混合架构的智能量化交易系统研究: 融合SSDA与LSTM自编码器的特征提取与决策优化方法
本文探讨了在量化交易中结合时序特征和静态特征的混合建模方法。通过整合堆叠稀疏降噪自编码器(SSDA)和基于LSTM的自编码器(LSTM-AE),构建了一个能够全面捕捉市场动态特性的交易系统。SSDA通过降噪技术提取股票数据的鲁棒表示,LSTM-AE则专注于捕捉市场的时序依赖关系。系统采用A2C算法进行强化学习,通过多维度的奖励计算机制,实现了在可接受的风险水平下最大化收益的目标。实验结果显示,该系统在不同波动特征的股票上表现出差异化的适应能力,特别是在存在明确市场趋势的情况下,决策准确性较高。
251 5
基于深度混合架构的智能量化交易系统研究: 融合SSDA与LSTM自编码器的特征提取与决策优化方法
|
9月前
|
人工智能 编解码 自然语言处理
AI运用爆发时代, 视频服务云原生底座“视频云”架构的全智能再进化
本文介绍了AI运用爆发时代下,视频服务云原生底座“视频云”架构的全智能再进化。随着AI技术的发展,视频内容和交互方式正经历深刻变革。文章从背景、视频AI应用挑战、视频云网端底座、AIGC时代的全智能化及未来展望五个方面展开讨论。重点阐述了云、网、端三者如何深度融合,通过AI赋能视频采集、生产、分发和消费全流程,实现视频处理的智能化和高效化。同时,展望了未来AI在视频领域的创新应用和潜在的杀手级应用。
319 0

热门文章

最新文章