官方博客-第18页-阿里云开发者社区

子白

2024-05-15

102443

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,443

德灵

2024-05-15

118057

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,057

ModelScope

2024-05-15

1851

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,851

ModelScope

2024-05-15

1147

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,147

易定

2024-12-06

1039

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,039

李德

2024-12-06

1337

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

本文章基于业务实践，总结有关客服质检场景的解决方案和处理经验，为相似场景提供可行的借鉴方法。

李德

1,337

阿里云云原生

2025-04-28

653

利用通义灵码和魔搭 Notebook 环境快速搭建一个 AIGC 应用 | 视频课

当我们熟悉了通义灵码的使用以及 Notebook 的环境后，大家可以共同探索 AIGC 的应用的更多玩法。

阿里云云原生

653

阿里云云原生

2025-05-14

675

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

本文探讨了如何高效、经济且可靠地将海外应用与基础设施日志统一采集至阿里云日志服务(SLS)，解决全球化业务扩展中的关键挑战。重点介绍了高性能日志采集Agent（iLogtail/LoongCollector）在海外场景的应用，推荐使用LoongCollector以获得更优的稳定性和网络容错能力。同时分析了多种网络接入方案，包括公网直连、全球加速优化、阿里云内网及专线/CEN/VPN接入等，并提供了成本优化策略和多目标发送配置指导，帮助企业构建稳定、低成本、高可用的全球日志系统。

阿里云云原生

675

阿里云云原生

2025-08-11

299

MSE Nacos Controller：为 Kubernetes 生态构建配置管理与服务发现的桥梁

在企业云原生转型过程中，如何实现传统微服务与 Kubernetes 服务的配置统一管理、服务互通及协议转换成为关键挑战。MSE Nacos Controller 应运而生，作为连接 Kubernetes 与 Nacos 的桥梁，支持 ConfigMap 与 Nacos 配置双向同步、服务自动注册发现，并助力 Higress 等 MCP 网关实现 REST API 向 AI 可调用 MCP 服务的转换，全面提升系统治理能力与智能化水平。

阿里云云原生

299

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

阿里云PAI大模型RAG对话系统最佳实践

Multi-Agent实践第7期：智能体的高效协作

vLLM部署Yuan2.0：高吞吐、更便捷

【实战干货】AI大模型工程应用于车联网场景的实战总结

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

利用通义灵码和魔搭 Notebook 环境快速搭建一个 AIGC 应用 | 视频课

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

MSE Nacos Controller：为 Kubernetes 生态构建配置管理与服务发现的桥梁

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

阿里云PAI大模型RAG对话系统最佳实践

Multi-Agent实践第7期：智能体的高效协作

vLLM部署Yuan2.0：高吞吐、更便捷

【实战干货】AI大模型工程应用于车联网场景的实战总结

【阅读十分钟，百分百成功】——通过大模型实现对客服回答的质量评估

利用通义灵码和魔搭 Notebook 环境快速搭建一个 AIGC 应用 | 视频课

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

MSE Nacos Controller：为 Kubernetes 生态构建配置管理与服务发现的桥梁