官方博客-第32页-阿里云开发者社区

望宸

2025-02-20

616

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

616

亦达

2025-02-20

685

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

685

是溪诚全南也

2025-02-28

924

1分钟集成DeepSeek满血版！搭建智能运维助手

阿里云 AI 搜索开放平台面向企业及开发者提供丰富的组件化AI搜索服务，本文将重点介绍基于AI搜索开放平台内置的 DeepSeek-R1 系列大模型，如何搭建 Elasticsearch AI Assistant。

是溪诚全南也等

924

阿里云开发者

2025-03-27

195

利用DeepSeek帮我做金融理财

本篇文章将介绍如何搭建一套基于 XXL-JOB + Deepseek 的定时数据分析系统，帮你做一个智能的金融理财助手。

阿里云开发者

195

以珩

2025-04-10

475

用自定义插件生成一篇图文并茂的文章

本文是《5步教你创建大模型自定义插件》的下篇，主要就已有的自定义插件中的生图能力为例，演示如何生成一个图文并茂的文章。

以珩

475

阿里云实时计算Flink

2023-04-13

1219

海量数据实时分析引擎 Apache Flink

当系统出现大量或者重大的错误却不被人感知，将会对业务产生影响，从而导致资产损失。当竞争对手实施了新战术，却无法及时感知，跟不上竞争对手的节奏，总是追着对方尾巴走。当要做决策的时候，海量的业务数据增长却无法实时看到聚合结果，决策总是凭借过往经验或者过时的数据分析之上。

阿里云实时计算Flink

1,219

怀潜

2023-05-10

2854

Hologres+大模型初探，让ChatGPT回答商家问题

本文介绍基于Hologres+ChatGPT提供智能客服服务的实践。

怀潜

2,854

执壹海平塞缪

2023-06-02

7107

深度解析PolarDB DDL锁的优化和演进

DDL是数据库所有SQL操作中最繁重的一种，本文总结介绍了云原生数据库PolarDB中DDL全链路MDL锁治理的经验和进展，持续优化用户的使用体验，为用户打造最佳的云原生数据库。

执壹海平塞缪等

7,107

勿烦

2023-12-01

861

MaxCompute 重装上阵，Global Zorder

MaxCompute支持Global Zorder，使得整个表或者分区的数据在全局上能按照指定字段进行ZORDER排序，以便数据能有更好的聚集性。

勿烦

861

官方博客-第32页-阿里云开发者社区

类目筛选

内容类型

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

1分钟集成DeepSeek满血版！搭建智能运维助手

利用DeepSeek帮我做金融理财

用自定义插件生成一篇图文并茂的文章

海量数据实时分析引擎 Apache Flink

Hologres+大模型初探，让ChatGPT回答商家问题

深度解析PolarDB DDL锁的优化和演进

MaxCompute 重装上阵，Global Zorder

官方博客-第32页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

1分钟集成DeepSeek满血版！搭建智能运维助手

利用DeepSeek帮我做金融理财

用自定义插件生成一篇图文并茂的文章

海量数据实时分析引擎 Apache Flink

Hologres+大模型初探，让ChatGPT回答商家问题

深度解析PolarDB DDL锁的优化和演进

MaxCompute 重装上阵，Global Zorder