官方博客-第15页-阿里云开发者社区

才胜南也

2024-09-05

1005

RAG效果优化：高质量文档解析详解

本文关于如何将非结构化数据（如PDF和Word文档）转换为结构化数据，以便于RAG（Retrieval-Augmented Generation）系统使用。

才胜南也

1,005

亦达

2025-02-20

746

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

746

子丑雅纯

2024-05-15

123429

提升团队工程交付能力，从“看见”工程活动和研发模式开始

本文从统一工程交付的概念模型开始，介绍了如何将应用交付的模式显式地定义出来，并通过工具平台落地。

子丑雅纯

123,429

ModelScope

2024-05-15

1184

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,184

阿里云实时数仓Hologres

2024-06-18

2343

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

2,343

阿里云实时数仓Hologres

2024-06-27

103026

Hologres+Flink企业级实时数仓核心能力介绍

通过Hologres+Flink构建易用、统一的企业级实时数仓。

阿里云实时数仓Hologres

103,026

浅奕

2024-09-24

594

通过实验深入了解 TCP 数据的发送和接收

本系列文章是组内写给新人和实习生的 TCP入门系列教程，结合了理论和实践，本篇为第二篇，建议先读上篇《通过实验深入了解TCP 连接的建立和关闭》。

浅奕

594

ModelScope

2025-06-16

570

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

570

阿里云云原生

554

3个月，上百家企业交流，和大家聊聊AI应用的落地实践（开篇）

企业希望自己的业务被 AI 赋能的诉求是强烈的，但大多数企业是不知道从哪里下手的

阿里云云原生

554

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

RAG效果优化：高质量文档解析详解

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

提升团队工程交付能力，从“看见”工程活动和研发模式开始

vLLM部署Yuan2.0：高吞吐、更便捷

森马基于MaxCompute+Hologres+DataWorks构建数据中台

Hologres+Flink企业级实时数仓核心能力介绍

通过实验深入了解 TCP 数据的发送和接收

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

3个月，上百家企业交流，和大家聊聊AI应用的落地实践（开篇）

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

RAG效果优化：高质量文档解析详解

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

提升团队工程交付能力，从“看见”工程活动和研发模式开始

vLLM部署Yuan2.0：高吞吐、更便捷

森马基于MaxCompute+Hologres+DataWorks构建数据中台

Hologres+Flink企业级实时数仓核心能力介绍

通过实验深入了解 TCP 数据的发送和接收

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

3个月，上百家企业交流，和大家聊聊AI应用的落地实践（开篇）