官方博客-第11页-阿里云开发者社区

ModelScope

2024-05-15

1322

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,322

新念

2025-02-14

1570

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,570

阿里云云原生

2025-06-24

668

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

通义灵码现已全面支持Qwen3，新增智能体模式，具备自主决策、环境感知、工具使用等能力，可端到端完成编码任务。支持问答、文件编辑、智能体多模式自由切换，结合MCP工具与记忆功能，提升开发效率。AI IDE重构编程流程，让开发更智能高效。

阿里云云原生

668

望宸

2025-02-28

1294

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,294

阿里云云原生

2025-06-03

1272

实现企业级 MCP 服务统一管理和智能检索的实践

本文将深入剖析 MCP Server 的五种主流架构模式，并结合 Nacos 服务治理框架，为企业级 MCP 部署提供实用指南。

阿里云云原生

1,272

ModelScope

2024-05-15

104825

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

104,825

龙蜥社区OpenAnolis

2024-11-06

888

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

888

李德

2024-12-06

1480

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,480

舟谨

2024-12-13

597

如何提取手写票据信息

本文主要讲述在处理票据信息结构化提取任务时，如何结合OCR（光学字符识别）技术和多模态大模型Qwen-VL来提高票据信息提取的准确性和效率。

舟谨

597

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

DeepSeek-V3 高效训练关键技术分析

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

大模型推理主战场：通信协议的标配

实现企业级 MCP 服务统一管理和智能检索的实践

手把手教你捏一个自己的Agent

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

如何提取手写票据信息

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

DeepSeek-V3 高效训练关键技术分析

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

大模型推理主战场：通信协议的标配

实现企业级 MCP 服务统一管理和智能检索的实践

手把手教你捏一个自己的Agent

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

如何提取手写票据信息