官方博客-第11页-阿里云开发者社区

子白

2024-05-15

102480

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,480

茏城

2024-06-28

1535

深度｜大模型时代下，基于湖仓一体的数据智能新范式

本次文根据峰会演讲内容整理：分享在大模型时代基于湖仓一体的数据产品演进，以及我们观察到的一些智能开发相关的新范式。

茏城

1,535

雨鸦

2024-12-27

1583

极简开发，极速上线：构建端到端大模型应用

本文将以一个经典的 RAG（检索增强生成）知识问答系统为例，详细介绍从智能体设计到最终应用部署的全流程。

雨鸦

1,583

灵杰开发者

2025-08-08

658

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

658

赵世振

2024-07-30

1981

阿里云百炼应用实践系列-AI助手快速搭建

本文主要介绍如何基于阿里云百炼平台快速在10分钟为您的网站添加一个 AI 助手。我们基于阿里云百炼平台的能力，以官方帮助文档为参考，搭建了一个以便全天候（7x24）回应客户咨询的AI助手，介绍了相关技术方案和主要代码，供开发者参考。

赵世振

1,981

阿里云瑶池数据库

2024-11-06

1751

大咖说｜Data+AI：企业智能化转型的核心驱动力

阿里云DMS+X：一站式Data+AI平台

阿里云瑶池数据库

1,751

亦达

2025-02-20

737

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

737

ModelScope

2024-05-15

1230

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,230

骐迹

2024-05-15

1961

阿里云SDWAN解决方案部署指南

利用阿里云丰富云网络产品，提供完整的SDWAN企业分支互联/企业上云解决方案。本次SDWAN解决方案部署指导场景以解决企业大陆分支机构、亚太IDC及云上VPC构建企业办公组网为例。意在指导客户在项目部署实施阶段可参考本文自助完成业务上线的搭建。本文内容已经对外披露。

骐迹

1,961

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

深度｜大模型时代下，基于湖仓一体的数据智能新范式

极简开发，极速上线：构建端到端大模型应用

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

阿里云百炼应用实践系列-AI助手快速搭建

大咖说｜Data+AI：企业智能化转型的核心驱动力

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

元象大模型开源30款量化版本加速低成本部署丨附教程

阿里云SDWAN解决方案部署指南

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

深度｜大模型时代下，基于湖仓一体的数据智能新范式

极简开发，极速上线：构建端到端大模型应用

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

阿里云百炼应用实践系列-AI助手快速搭建

大咖说｜Data+AI：企业智能化转型的核心驱动力

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

元象大模型开源30款量化版本 加速低成本部署丨附教程

阿里云SDWAN解决方案部署指南

元象大模型开源30款量化版本加速低成本部署丨附教程