官方博客-第23页-阿里云开发者社区

亦达

2025-02-20

695

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

695

阿里云云原生

2025-06-03

668

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

本文介绍了如何使用通义灵码编程智能体与高德 MCP 2.0 制作北京端午3天旅行攻略页面。首先需下载通义灵码 AI IDE 并获取高德申请的 key，接着通过添加 MCP 服务生成 travel_tips.html 文件，最终在手机端查看已发布上线的攻略。此外还详细说明了利用通义灵码打造专属 MCP 服务的过程，包括开发计划、代码编写、部署及连接服务等步骤，并提供了自由探索的方向及相关资料链接。

阿里云云原生

668

阿里云云原生

2025-06-24

524

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

通义灵码现已全面支持Qwen3，新增智能体模式，具备自主决策、环境感知、工具使用等能力，可端到端完成编码任务。支持问答、文件编辑、智能体多模式自由切换，结合MCP工具与记忆功能，提升开发效率。AI IDE重构编程流程，让开发更智能高效。

阿里云云原生

524

龙蜥社区OpenAnolis

2023-03-01

670

如何有效降低产品级内存数据库快照尾延迟

本文讲解内存键值对数据库在使用 fork 拍摄快照时引起的请求尾延迟激增问题如何解决的实践方案。

龙蜥社区OpenAnolis

670

笃敏

2024-05-15

1823

你好，iLogtail 2.0

你好，iLogtail 2.0！

笃敏

1,823

斜阳

2024-05-15

133376

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

133,376

资源编排ROS

2024-05-15

887

如何快速在钉钉群接入私有大模型

利用阿里云计算巢Appflow，通过控制台配置即可顺利将您自己开发或微调的大模型接入钉钉或其他通信软件群聊，帮您解决以下各类场景的模型调用需求： 1. 在钉钉群接入自己微调的领域大模型做问答或智能答疑； 2. 微调后的大模型在钉钉群或其他群聊中共同测试效果 3. …

资源编排ROS

887

ModelScope

2024-05-15

1213

快来与 CodeQwen1.5 结对编程

今天，来自 Qwen1.5 开源家族的新成员，代码专家模型 CodeQwen1.5开源！CodeQwen1.5 基于 Qwen 语言模型初始化，拥有 7B 参数的模型，其拥有 GQA 架构，经过了 ~3T tokens 代码相关的数据进行预训练，共计支持 92 种编程语言、且最长支持 64K 的上下文输入。效果方面，CodeQwen1.5 展现出了优秀的代码生成、长序列建模、代码修改、SQL 能力等,该模型可以大大提高开发人员的工作效率，并在不同的技术环境中简化软件开发工作流程。

ModelScope

1,213

阿里云云原生

2024-05-21

57446

函数计算助力领健信息为“看牙”注入 AI 活力

口腔治疗+函数计算=效率提升🚀 领健作为业界领先的口腔机构，面向口腔诊所提供正畸算法，但早期的算法部署遇到较多问题，因此在对比了阿里云的多个云产品之后，最终选择了函数计算。通过将 GPU 计算负载放到函数计算，领健技术团队达到了很好的降本效果，相比早前的按月持有 GPU 资源，函数计算的费用降低了 90% 左右，并大大提升了使用体验，实现了前所未有的敏捷性和效率。

阿里云云原生

57,446

官方博客-第23页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

如何有效降低产品级内存数据库快照尾延迟

你好，iLogtail 2.0

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

如何快速在钉钉群接入私有大模型

快来与 CodeQwen1.5 结对编程

函数计算助力领健信息为“看牙”注入 AI 活力

官方博客-第23页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

端午出游高定：通义灵码+高德 MCP 10 分钟定制出游攻略

通义灵码用户说 | 编程智能体+MCP加持，秒查附近蜜雪冰城

如何有效降低产品级内存数据库快照尾延迟

你好，iLogtail 2.0

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

如何快速在钉钉群接入私有大模型

快来与 CodeQwen1.5 结对编程

函数计算助力领健信息为“看牙”注入 AI 活力