文章标签：

自然语言处理

人工智能

机器学习/深度学习

测试技术

网络架构

算法

关键词：

架构模型

moe架构

开源架构

架构推理

开源架构推理模型

相关文章

Deephub

|

3月前

|

机器学习/深度学习人工智能监控

大型动作模型LAM：让企业重复任务实现80%效率提升的AI技术架构与实现方案

大型动作模型（LAMs）作为人工智能新架构，融合神经网络与符号逻辑，实现企业重复任务的自动化处理。通过神经符号集成、动作执行管道、模式学习、任务分解等核心技术，系统可高效解析用户意图并执行复杂操作，显著提升企业运营效率并降低人工成本。其自适应学习能力与上下文感知机制，使自动化流程更智能、灵活，为企业数字化转型提供坚实支撑。

Deephub

259 0 0

scvonalwkd4hw

|

4月前

|

数据采集人工智能安全

开源赋能双碳：MyEMS 能源管理系统的架构与实践价值

在全球碳中和趋势与“双碳”目标推动下，能源管理趋向精细化与智能化。MyEMS是一款基于Python开发的开源能源管理系统，具备灵活适配、功能全面的优势，覆盖工厂、建筑、数据中心等多元场景。系统支持能源数据采集、分析、可视化及设备管理、故障诊断、AI优化控制等功能，提供“监测-分析-优化”闭环解决方案。遵循“国家+省级+接入端”三级架构，MyEMS在重点用能单位能耗监测中发挥关键作用，助力实现能源效率提升与政策合规。开源模式降低了技术门槛，推动“双碳”目标落地。

scvonalwkd4hw

159 0 0

Deephub

|

2月前

|

数据采集机器学习/深度学习搜索推荐

MIT新论文：数据即上限，扩散模型的关键能力来自图像统计规律，而非复杂架构

MIT与丰田研究院研究发现，扩散模型的“局部性”并非源于网络架构的精巧设计，而是自然图像统计规律的产物。通过线性模型仅学习像素相关性，即可复现U-Net般的局部敏感模式，揭示数据本身蕴含生成“魔法”。

Deephub

126 3 3

向量引擎api

|

2月前

|

Cloud Native API 开发者

Gemini 2.5 Flash 技术拆解：从 MoE 架构到阿里云生态落地指南

2025年9月，谷歌Gemini 2.5 Flash发布，性能提升5%、成本降24%，引发行业关注。其MoE架构、百万上下文与“思考”范式，助力阿里云开发者高效构建云原生应用。本文解析技术内核，结合汽车、物流等案例，提供落地指南与避坑建议，展望大模型与流计算融合前景。

向量引擎api

266 6 6

aliyun9170107523-43660

|

1月前

|

机器学习/深度学习存储缓存

115_LLM基础模型架构设计：从Transformer到稀疏注意力

大型语言模型（LLM）的架构设计是其性能的核心决定因素。从2017年Transformer架构的提出，到如今的稀疏注意力和混合专家模型，LLM架构经历了快速的演进。本文将全面探讨LLM基础架构的设计原理，深入分析Transformer的核心机制，详细介绍稀疏注意力、MoE等创新架构，并展望未来架构发展方向。通过数学推导和实践案例，为构建高效、强大的LLM提供全面指导。

aliyun9170107523-43660

355 0 0

aliyun9170107523-43660

|

1月前

|

机器学习/深度学习自然语言处理算法

48_动态架构模型：NAS在LLM中的应用

大型语言模型（LLM）在自然语言处理领域的突破性进展，很大程度上归功于其庞大的参数量和复杂的网络架构。然而，随着模型规模的不断增长，计算资源消耗、推理延迟和部署成本等问题日益凸显。如何在保持模型性能的同时，优化模型架构以提高效率，成为2025年大模型研究的核心方向之一。神经架构搜索（Neural Architecture Search, NAS）作为一种自动化的网络设计方法，正在为这一挑战提供创新性解决方案。本文将深入探讨NAS技术如何应用于LLM的架构优化，特别是在层数与维度调整方面的最新进展，并通过代码实现展示简单的NAS实验。

aliyun9170107523-43660

85 0 0

aliyun9170107523-43660

|

1月前

|

机器学习/深度学习缓存人工智能

45_混合专家模型：MoE架构详解

在大语言模型的发展历程中，参数规模的扩张一直被视为提升性能的主要途径。然而，随着模型参数达到数百亿甚至数千亿级别，传统的密集型模型架构面临着计算资源、训练效率和推理速度等诸多挑战。2025年，混合专家模型（Mixture of Experts，MoE）已成为突破这些限制的关键技术路径。

aliyun9170107523-43660

463 0 0

Deephub

|

3月前

|

编解码文字识别自然语言处理

Dots.ocr：告别复杂多模块架构，1.7B参数单一模型统一处理所有OCR任务22

Dots.ocr 是一款仅1.7B参数的视觉语言模型，正在重塑文档处理技术。它将布局检测、文本识别、阅读顺序理解和数学公式解析等任务统一于单一架构，突破传统OCR多模块流水线的限制。在多项基准测试中，其表现超越大参数模型，展现出“小而精”的实用价值，标志着OCR技术向高效、统一、灵活方向演进。

Deephub

406 0 0

Dots.ocr：告别复杂多模块架构，1.7B参数单一模型统一处理所有OCR任务22

蒋星熠Jaxonic

|

1月前

|

Cloud Native Serverless API

微服务架构实战指南：从单体应用到云原生的蜕变之路

🌟蒋星熠Jaxonic，代码为舟的星际旅人。深耕微服务架构，擅以DDD拆分服务、构建高可用通信与治理体系。分享从单体到云原生的实战经验，探索技术演进的无限可能。

蒋星熠Jaxonic

202 4 4

ModelScope模型即服务

自然语言处理

热门文章

最新文章

1

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

2

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

3

Qlib：华尔街颤抖！微软开源金融AI量化投资神器，助力智能投研

4

Cline：29.7K Star！一文详解VSCode最强开源AI编程搭子：一键生成代码+自动跑终端+操控浏览器...

5

Spring AI Alibaba、Dify、LangGraph 与 LangChain 综合对比分析报告

6

FastAPI开发者福音！FastAPI-MCP：将FastAPI秒变MCP服务器的开源神器，无需配置自动转换！

7

RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow、Anything-LLM,以及更多推荐

8

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！

9

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

10

手把手教你使用 Ollama 和 LobeChat 快速本地部署 DeepSeek R1 模型，创建个性化 AI 助手

1

Spring AI Alibaba、Dify、LangGraph 与 LangChain 综合对比分析报告

101

2

ACL 2025 | GALLa：用图结构增强代码大模型，让代码理解更精准！

398

3

小米7B参数推理大模型首次开源！Xiaomi MiMo：数学代码双杀，超越32B巨头

886

4

这个AI把arXiv变成代码工厂，快速复现顶会算法！Paper2Code：AI论文自动转代码神器，多智能体框架颠覆科研复现

797

5

Cooragent：清华 LeapLab 开源 AI Agent 协作框架，一句话召唤AI军团！

766

6

LongPort MCP：证券业首个券商MCP，AI赋能智能投资新时代，散户也能玩转机构级交易

893

7

让AI单次生成4万字！WriteHERE：开源AI长文写作框架，单次生成超长文本，小说报告一键搞定！

911

8

全球首款开源通用型AI智能体上线！Suna：自动处理Excel/爬数据/写报告等复杂任务一句话搞定

1552

9

Yuxi-Know：开源智能问答系统，基于大模型RAG与知识图谱技术快速构建知识库

1520

10

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！

1255

相关商品

相关课程

更多

Serverless 函数计算架构

架构的演进

MySQL企业常见架构与调优经验分享

企业Web常用架构LAMP-LNMP实战

企业级互联网分布式系统应用架构学习

高校精品课-上海交通大学 -企业级应用体系架构

相关电子书

更多

云栖大会：开源 PolarDB 架构演进、关键技术与社区建设

从技术到架构，云原生全面加速应用现代化

MaxCompute架构升级及开放性解读

下一篇

一文了解：阿里云对象存储OSS是什么？