子白

2024-05-15

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

101,090

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

42034

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

42,034

ModelScope

2024-05-15

841

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

841

古琦

2024-07-04

108313

全链路追踪 & 性能监控，GO 应用可观测全面升级

当前，大多数面向 Golang 应用的监控能力主要是通过 SDK 方式接入，需要开放人员手动进行埋点，会存在一定问题。对此，可观测 Go Agent 应运而生。本文介绍的阿里云可观测 Go Agent 方案，能通过无侵入的方式实现应用监控能力。

古琦

108,313

张昕东

2024-07-25

12895

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

SDCon 全球软件技术大会上，阿里云通义灵码团队分享了关于 AI 辅助编码的最新研究与实践，随着 AIGC 技术的发展，软件研发领域将迎来智能化的新高度，助力 DevOps 流程优化，提升研发效率和研发幸福感。

张昕东

12,895

ModelScope

2024-05-15

1196

在魔搭使用ComfyUI，玩转AIGC

ComfyUI是一个功能强大、模块化程度高的AIGC图形和视频生成的用户界面和后台。

ModelScope

1,196

悟鸣

2024-05-15

238470

一文掌握大模型提示词技巧：从战略到战术

本文将用通俗易懂的语言，带你从战略（宏观）和战术（微观）两个层次掌握大模型提示词的常见技巧，真正做到理论和实践相结合，占领 AI 运用的先机。

悟鸣

238,470

米基

2024-05-15

796

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

796

ModelScope

2024-05-15

694

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

694

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

全链路追踪 & 性能监控，GO 应用可观测全面升级

通义灵码：AI 研发趋势与效果提升实践丨SDCon 全球软件技术大会演讲全文整理

在魔搭使用ComfyUI，玩转AIGC

一文掌握大模型提示词技巧：从战略到战术

大模型推理优化实践：KV cache复用与投机采样

Multi-Agent实践第7期：智能体的高效协作