官方博客-第5页-阿里云开发者社区

望宸

2025-02-20

894

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

894

翎薇

2025-05-22

2416

本文介绍了MCP（Model Context Protocol）与Qwen3模型的结合应用。MCP通过统一协议让AI模型连接各种工具和数据源，类似AI世界的“USB-C”接口。文中详细解析了MCP架构，包括Host、Client和Server三个核心组件，并说明了模型如何智能选择工具及工具执行反馈机制。Qwen3作为新一代通义千问模型，采用混合专家架构，具备235B参数但仅需激活22B，支持快速与深度思考模式，多语言处理能力覆盖119种语言。文章还展示了Qwen3的本地部署流程，以及开发和调试MCP Server与Client的具体步骤。

翎薇

2,416

元丹

2024-05-15

283058

深入浅出LangChain与智能Agent：构建下一代AI助手

LangChain为大型语言模型提供了一种全新的搭建和集成方式，通过这个强大的框架，我们可以将复杂的技术任务简化，让创意和创新更加易于实现。本文从LangChain是什么到LangChain的实际案例到智能体的快速发展做了全面的讲解。

元丹

283,058

学仁

2025-05-29

2404

管理和调度Dify工作流

Dify是一款开源的大模型应用开发平台，支持通过可视化界面快速构建AI Agent和工作流。然而，Dify本身缺乏定时调度与监控报警功能，且执行记录过多可能影响性能。为解决这些问题，可采用Dify Schedule或XXL-JOB集成Dify工作流。Dify Schedule基于GitHub Actions实现定时调度，但仅支持公网部署、调度延时较大且配置复杂。相比之下，XXL-JOB提供秒级调度、内网安全防护、限流控制及企业级报警等优势，更适合大规模、高精度的调度需求。两者对比显示，XXL-JOB在功能性和易用性上更具竞争力。

学仁

2,404

唐殊

2024-11-01

2301

探索LLM推理全阶段的JSON格式输出限制方法

文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

唐殊

2,301

ModelScope

2025-05-23

1808

通义灵码 + 魔搭MCP：全流程构建创空间应用

最近，通义灵码上线 MCP（ModelScope Cloud Platform）功能，从之前代码生成及修改的基础功能，到可以使用MCP服务连接更多功能，开发者可以实现从代码爬取、模型推理到应用部署

ModelScope

1,808

孤弋正己

2025-05-29

3224

MCP Server的五种主流架构与Nacos的选择

本文深入探讨了Model Context Protocol (MCP) 在企业级环境中的部署与管理挑战，详细解析了五种主流MCP架构模式（直连远程、代理连接远程、直连本地、本地代理连接本地、混合模式）的优缺点及适用场景，并结合Nacos服务治理框架，提供了实用的企业级MCP部署指南。通过Nacos MCP Router，实现MCP服务的统一管理和智能路由，助力金融、互联网、制造等行业根据数据安全、性能需求和扩展性要求选择合适架构。文章还展望了MCP在企业落地的关键方向，包括中心化注册、软件供应链控制和安全访问等完整解决方案。

孤弋正己

3,224

牧申景穆

2024-09-02

3575

【算法精讲系列】阿里云百炼SFT微调实践分享

本内容为您提供了百炼平台SFT微调的实践案例，帮助您方便并快速借助模型微调定制化您自己的专属模型。

牧申景穆

3,575

赵世振

2024-12-24

1595

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,595

官方博客-第5页-阿里云开发者社区

类目筛选

内容类型

大模型推理服务全景图

多快好省，Qwen3混合部署模式引爆MCP

深入浅出LangChain与智能Agent：构建下一代AI助手

管理和调度Dify工作流

探索LLM推理全阶段的JSON格式输出限制方法

通义灵码 + 魔搭MCP：全流程构建创空间应用

MCP Server的五种主流架构与Nacos的选择

【算法精讲系列】阿里云百炼SFT微调实践分享

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

官方博客-第5页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理服务全景图

多快好省，Qwen3混合部署模式引爆MCP

深入浅出LangChain与智能Agent：构建下一代AI助手

管理和调度Dify工作流

探索LLM推理全阶段的JSON格式输出限制方法

通义灵码 + 魔搭MCP：全流程构建创空间应用

MCP Server的五种主流架构与Nacos的选择

【算法精讲系列】阿里云百炼SFT微调实践分享

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法