官方博客-第24页-阿里云开发者社区

亦达

2025-02-20

708

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

708

阿里云云原生

2025-02-25

1115

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,115

泓逸

2025-04-07

345

不断突破极致：SPL新版数据加工能力焕新登场

SPL 算子不仅完成了旧版 DSL 加工向更强大语法和算子形式的过渡，更将性能调优和场景适配做到了极致，解锁了时序预测和日志分析的更多可能性。作为重要的基础设施模块，SPL 加工能力将持续优化演进。未来的规划将继续聚焦通用性、性能与产品能力，为用户提供更加强大、灵活的技术支持。

泓逸

345

濯光于怀

2025-04-07

366

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

AI 应用开发中，总有一些让人头疼的问题：敏感信息（比如 API-KEY）怎么安全存储？模型参数需要频繁调整怎么办？Prompt 模板改来改去，每次都得重启服务，太麻烦了！别急，今天我们就来聊聊如何用 Nacos 解决这些问题。

濯光于怀

366

以珩

2025-04-10

496

用自定义插件生成一篇图文并茂的文章

本文是《5步教你创建大模型自定义插件》的下篇，主要就已有的自定义插件中的生图能力为例，演示如何生成一个图文并茂的文章。

以珩

496

隆基

2024-05-15

88928

RocketMQ 流存储解析：面向流场景的关键特性与典型案例

隆基

88,928

ModelScope

2024-05-15

2577

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,577

ModelScope

2024-05-15

1378

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

1,378

虎鸣

2024-05-15

777

Java 22 新增利器：使用 Java Stream Gather 优雅地处理流中的状态

本文中我们分析了什么是 “流”，对比了 Java 上几种常见的 “流”库，引入和详细介绍了 Java 22 中的 Stream Gather API 。同时也简单分享了利用虚拟线程如何简化 Stream map Concurrent操作符的实现。希望抛砖引玉和大家分享新的特性，共同进步。同时也希望大家都可以升级到新版本的 JDK，更好的赋能业务。

虎鸣

777

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

解锁 DeepSeek 安全接入、稳定运行新路径

不断突破极致：SPL新版数据加工能力焕新登场

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

用自定义插件生成一篇图文并茂的文章

RocketMQ 流存储解析：面向流场景的关键特性与典型案例

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

Java 22 新增利器：使用 Java Stream Gather 优雅地处理流中的状态

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

解锁 DeepSeek 安全接入、稳定运行新路径

不断突破极致：SPL新版数据加工能力焕新登场

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

用自定义插件生成一篇图文并茂的文章

RocketMQ 流存储解析：面向流场景的关键特性与典型案例

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

Java 22 新增利器： 使用 Java Stream Gather 优雅地处理流中的状态

Java 22 新增利器：使用 Java Stream Gather 优雅地处理流中的状态