子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,252

悟鸣

2024-05-15

238580

一文掌握大模型提示词技巧：从战略到战术

本文将用通俗易懂的语言，带你从战略（宏观）和战术（微观）两个层次掌握大模型提示词的常见技巧，真正做到理论和实践相结合，占领 AI 运用的先机。

悟鸣

238,580

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

42161

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

42,161

阿里云云原生

2024-08-21

600

用好通义灵码，让这款 AI 编码助手帮你做更多工作

通义灵码提供了一系列快捷键和配置选项以增强开发体验。

阿里云云原生

600

阿里云存储

2024-05-15

94931

AIGC训练场景下的存储特征研究

在今天这样以AIGC为代表的AI时代下，了解训练场景对于存储的具体诉求同样是至关重要的。本文将尝试解读WEKA的一个相关报告，来看看AIGC对于存储有哪些具体的性能要求。

阿里云存储

94,931

探索云世界

2024-05-15

622

一文理解淘宝购物车背后的逻辑

提升用户的使用体验才是产品升级的核心，本文将从业务发展以及技术沉淀两个方面来总结淘宝购物车的产品升级之路。

探索云世界

622

余韬

2024-08-13

224

跟着 iLogtail 学习高质量软件建设

复杂的运行环境、巨大的部署量和高速发展业务迭代对 Agent 的软件工程质量带来了巨大挑战。基于阿里云可观测团队多年的开发和运维经验，本文将分享如何构建和执行可靠性工程策略。

余韬

224

为常

2024-08-27

106

面向AI场景的数据处理和数据检索

本文分享了AI场景下面临的数据处理与检索挑战及解决方案。AI内容生产涉及数据准备、模型训练、推理及应用四大环节，其中数据准备环节面临数据来源复杂、格式多样及数据量激增的挑战，模型训练环节需解决推理准确性问题，AI应用环节则需克服接口兼容性难题。为应对这些挑战，阿里云存储OSS与智能媒体管理IMM提供百余种数据处理能力，并升级数据索引功能支持向量检索，助力构建多模态检索应用。此外，还介绍了Serverless数据处理方案，可日均处理百亿级别文件，通过OSS数据索引能力，客户能快速构建RAG检索增强，同时实现多模态检索的搭建，显著提升AI应用的效能和用户体验。

为常

106

斜阳

2024-05-15

132542

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化

斜阳

132,542

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

一文掌握大模型提示词技巧：从战略到战术

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

用好通义灵码，让这款 AI 编码助手帮你做更多工作

AIGC训练场景下的存储特征研究

一文理解淘宝购物车背后的逻辑

跟着 iLogtail 学习高质量软件建设

面向AI场景的数据处理和数据检索

谈谈 RocketMQ 5.0 分级存储背后一些有挑战的技术优化