官方博客-第18页-阿里云开发者社区

亦达

2025-02-20

746

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

746

阿里云云原生

2025-04-17

1277

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

通义灵码新上的外挂 Project Rules 获得了开发者的一致好评：最小成本适配我的开发风格、相当把团队经验沉淀下来，是个很好功能……

阿里云云原生

1,277

阿里云云原生

2025-05-23

582

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

582

阿里云实时计算Flink

2023-02-21

1016

FlinkSQL 的行级权限解决方案及源码

FlinkSQL的行级权限解决方案及源码，支持面向用户级别的行级数据访问控制，即特定用户只能访问授权过的行，隐藏未授权的行数据。此方案是实时领域Flink的解决方案，类似离线数仓Hive中Ranger Row-level Filter方案。

阿里云实时计算Flink

1,016

栾枝

2023-07-18

131032

手把手教你使用OSS-HDFS服务平替自建HDFS

本文主要介绍了OSS-HDFS服务以及使用OSS-HDFS服务平替自建HDFS。

栾枝

131,032

ModelScope

2024-05-15

1155

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,155

阿里云实时数仓Hologres

2024-06-18

2343

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

2,343

羿莉

2024-08-06

8808

基于“日志审计应用”的 DNS 日志洞察实践

DNS 解析日志是一种记录 DNS 请求和响应的基础信息，监控 DNS 服务可以帮助用户识别网络活动并保持系统安全。日志审计服务支持采集 DNS 内网解析日志、公网权威解析日志、GTM 日志。理解 DNS 日志的字段含义，洞察 DNS 日志背后所代表的网络信息，既可以帮助发现和诊断 DNS 解析相关的问题，还可以检测和识别潜在的安全威胁。

羿莉

8,808

阿里云云原生

2024-09-02

698

西游再现，一键部署 Flux 文生图大模型生成西游人物

从花果山的灵石出世，到取经路上的九九八十一难，再到大闹天宫的惊心动魄……这些耳熟能详的西游场景，如今都能通过 Flux 模型，以超乎想象的细节和真实感呈现在你眼前。本次实验在函数计算中内置的 flux.1-dev-fp8 大模型，搭配 Lora 模型，无需复杂的配置，一键部署，你就能成为这场视觉盛宴的创造者。

阿里云云原生

698

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

FlinkSQL 的行级权限解决方案及源码

手把手教你使用OSS-HDFS服务平替自建HDFS

LISA微调技术解析：比LoRA更低的显存更快的速度

森马基于MaxCompute+Hologres+DataWorks构建数据中台

基于“日志审计应用”的 DNS 日志洞察实践

西游再现，一键部署 Flux 文生图大模型生成西游人物

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

FlinkSQL 的行级权限解决方案及源码

手把手教你使用OSS-HDFS服务平替自建HDFS

LISA微调技术解析：比LoRA更低的显存更快的速度

森马基于MaxCompute+Hologres+DataWorks构建数据中台

基于“日志审计应用”的 DNS 日志洞察实践

西游再现，一键部署 Flux 文生图大模型生成西游人物