官方博客-第24页-阿里云开发者社区

亦达

2025-02-20

695

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

695

阿里云云原生

2025-05-28

473

不懂 PromQL，AI 智能体帮你玩转大规模指标数据分析

PromQL AI 智能体上线。本文将从自然语言生成 PromQL 实践视角，探讨如何构建知识库、与大模型进行交互、最终生成符合需求的 PromQL 语句。本文还介绍了在 MCP 和云监控控制台下使用 AI 智能体的用例。

阿里云云原生

473

阿里云云原生

2025-06-03

668

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

本文介绍了如何使用通义灵码编程智能体与高德 MCP 2.0 制作北京端午3天旅行攻略页面。首先需下载通义灵码 AI IDE 并获取高德申请的 key，接着通过添加 MCP 服务生成 travel_tips.html 文件，最终在手机端查看已发布上线的攻略。此外还详细说明了利用通义灵码打造专属 MCP 服务的过程，包括开发计划、代码编写、部署及连接服务等步骤，并提供了自由探索的方向及相关资料链接。

阿里云云原生

668

阿里云云原生

2025-06-24

524

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

通义灵码现已全面支持Qwen3，新增智能体模式，具备自主决策、环境感知、工具使用等能力，可端到端完成编码任务。支持问答、文件编辑、智能体多模式自由切换，结合MCP工具与记忆功能，提升开发效率。AI IDE重构编程流程，让开发更智能高效。

阿里云云原生

524

阿里云云原生

2025-08-11

282

MSE Nacos Controller：为 Kubernetes 生态构建配置管理与服务发现的桥梁

在企业云原生转型过程中，如何实现传统微服务与 Kubernetes 服务的配置统一管理、服务互通及协议转换成为关键挑战。MSE Nacos Controller 应运而生，作为连接 Kubernetes 与 Nacos 的桥梁，支持 ConfigMap 与 Nacos 配置双向同步、服务自动注册发现，并助力 Higress 等 MCP 网关实现 REST API 向 AI 可调用 MCP 服务的转换，全面提升系统治理能力与智能化水平。

阿里云云原生

282

龙蜥社区OpenAnolis

2023-03-01

670

如何有效降低产品级内存数据库快照尾延迟

本文讲解内存键值对数据库在使用 fork 拍摄快照时引起的请求尾延迟激增问题如何解决的实践方案。

龙蜥社区OpenAnolis

670

元乙

2023-11-06

128404

从存储统一到数据融合，SLS在可观测场景的思考和行动

介绍SLS在可观测数据融合分析的一系列技术升级，融合Trace、全栈监控、Continuous Profiling、移动端监控等功能，帮助大家更快速地构筑全栈、自动化的观测能力。

元乙

128,404

资源编排ROS

2024-05-15

887

如何快速在钉钉群接入私有大模型

利用阿里云计算巢Appflow，通过控制台配置即可顺利将您自己开发或微调的大模型接入钉钉或其他通信软件群聊，帮您解决以下各类场景的模型调用需求： 1. 在钉钉群接入自己微调的领域大模型做问答或智能答疑； 2. 微调后的大模型在钉钉群或其他群聊中共同测试效果 3. …

资源编排ROS

887

ModelScope

2024-05-15

1213

快来与 CodeQwen1.5 结对编程

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

ModelScope

1,213

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

不懂 PromQL，AI 智能体帮你玩转大规模指标数据分析

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

MSE Nacos Controller：为 Kubernetes 生态构建配置管理与服务发现的桥梁

如何有效降低产品级内存数据库快照尾延迟

从存储统一到数据融合，SLS在可观测场景的思考和行动

如何快速在钉钉群接入私有大模型

快来与 CodeQwen1.5 结对编程

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

不懂 PromQL，AI 智能体帮你玩转大规模指标数据分析

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

MSE Nacos Controller：为 Kubernetes 生态构建配置管理与服务发现的桥梁

如何有效降低产品级内存数据库快照尾延迟

从存储统一到数据融合，SLS在可观测场景的思考和行动

如何快速在钉钉群接入私有大模型

快来与 CodeQwen1.5 结对编程